3,583 papers
arXiv:2606.28379 74 19 июня 2026 г. FREE

LEDGER: карта зависимостей документа — чтобы правка одной части не сломала другие

КЛЮЧЕВАЯ СУТЬ
Модель на максимальной мощности рассуждений без карты проигрывает той же модели на простых настройках — но с явной картой зависимостей: 56% против 76% согласованности. Метод LEDGER позволяет редактировать длинные структурированные документы так, чтобы правка одной части не разваливала логику остальных. Перед правкой строишь карту: кто на кого ссылается, что от чего зависит по смыслу — и модель получает не весь документ, а только нужный отрывок плюс все связанные с ним части. Поменял термин в разделе 3 — модель сама видит, что раздел 7 теперь противоречит обещанию из раздела 2.
Адаптировать под запрос

TL;DR

Когда редактируешь длинный структурированный документ через LLM, главная проблема — не качество правки, а потеря связей. Поменял термин в одном разделе — а в трёх других он уже устарел. Переформулировал описание — а ссылки на «этот результат» теперь висят в воздухе. LEDGER решает это через явную карту зависимостей: какой раздел на что ссылается, что от чего зависит по смыслу.

Главный инсайт: LLM при правке длинного документа не отслеживает связи между частями. Получает на вход весь документ — и либо исправляет точечно, не замечая зависимостей, либо пытается держать всё в голове и ошибается. Исследование показало: без явной карты зависимостей согласованность документа после правки — около 56%. С явной картой — 76%.

Суть метода: перед правкой строишь карту — кто на кого ссылается, кто от кого зависит по смыслу. При каждой правке модель получает не весь документ, а только нужный отрывок плюс все связанные с ним части. После правки — проверка: не сломались ли ссылки, не разъехалась ли терминология.


🔬

Схема метода

ШАГ 1: Карта зависимостей (один промпт)
  → Явные ссылки: «Раздел 3 ссылается на Рисунок 2»
  → Неявные зависимости: «Раздел 5 опирается на определение из Раздела 2»
  → Смысловые связи: «Раздел 4 и Раздел 7 описывают одно и то же понятие»

ШАГ 2: Целевая правка (отдельный промпт)
  → Передаёшь: редактируемый отрывок + все зависимые секции + карту
  → Модель правит, зная что затронет

ШАГ 3: Проверка согласованности (отдельный промпт)
  → Список изменённых частей → проверка ссылок и терминологии
  → Если что-то сломалось — правка зависимых разделов

🚀

Пример применения

Задача: Переписываешь оффер для сайта. Документ — 8 страниц: описание продукта, блок с ценами, FAQ, блок гарантий, отзывы. Меняешь позиционирование с «экономия времени» на «рост выручки». Теперь нужно обновить все места, где упоминается старый смысл — и не пропустить ни одного.

Промпт (Шаг 1 — карта зависимостей):

Перед тобой документ — оффер продукта. Твоя задача: 
построй карту зависимостей между разделами.

Для каждого раздела укажи:
1. Явные ссылки: «В этом разделе явно упоминается [другой раздел/блок/термин]»
2. Смысловые зависимости: «Этот раздел опирается на идею/обещание из [другого раздела]»
3. Терминологию: ключевые слова и формулировки, которые повторяются в нескольких местах

Формат:
[Название раздела] → явные ссылки: [...] | зависит от: [...] | термины: [...]

[Вставь документ]

Промпт (Шаг 2 — правка с картой):

Вот карта зависимостей документа:
[вставь карту из шага 1]

Вот разделы, которые нужно обновить в связи с правкой:
[вставь только затронутые разделы + зависимые]

Задача: замени позиционирование «экономия времени» → «рост выручки» 
в разделе [X]. Убедись, что все зависимые разделы остаются согласованными.

Выведи:
1. Обновлённые разделы
2. Что изменил в каждом и почему
3. Что нужно проверить вручную

Результат:

На шаге 1 модель вернёт структурированный список: какой блок на что ссылается, какие термины сквозные. На шаге 2 — обновлённые тексты только затронутых разделов и явный список что изменилось и почему. Не нужно читать весь документ самому — модель сама укажет точки риска.


🧠

Почему это работает

Слабость LLM при работе с длинными документами: модель не держит в голове структурные связи. Она хорошо правит то, что видит прямо сейчас — но не отслеживает, что поменянный термин в разделе 3 разрушает логику раздела 7. Чем длиннее документ, тем хуже: внимание «размазывается», важное тонет в потоке текста.

Что модель умеет хорошо: следовать явным инструкциям. Если написать «вот что от чего зависит — учти при правке», модель это учтёт. Исследование показало принципиальный результат: явная карта зависимостей заменяет дорогостоящее внутреннее рассуждение. Модель с простыми настройками + явной картой обгоняет ту же модель на максимальной мощности рассуждений, но без карты.

Как метод использует это: карта делает невидимые связи видимыми. Вместо «держи весь документ в голове» — «вот конкретный список что затронет правка». Это убирает двусмысленность и фокусирует внимание точно туда, куда нужно.

Рычаги управления: - Детализация карты — для простого текста достаточно ключевых терминов; для договоров и техзаданий нужны явные ссылки - Шаг проверки — можно пропустить для черновых правок, обязателен для финальных версий - Контекст правки — передавай только затронутые разделы + зависимые, не весь документ


📋

Шаблон промпта

📌

Шаг 1: Карта зависимостей

Проанализируй документ и построй карту зависимостей.

Для каждого раздела/блока укажи:
- Явные ссылки: на какие другие разделы, рисунки, таблицы или понятия ссылается
- Смысловые зависимости: какие утверждения/обещания из других разделов 
  необходимы для понимания этого раздела
- Сквозные термины: ключевые слова, которые встречаются в нескольких местах

Формат вывода:
[Название раздела]
  → Явные ссылки: [список]
  → Зависит от: [список]  
  → Сквозные термины: [список]

Документ:
{документ}
📌

Шаг 2: Правка с учётом зависимостей

Карта зависимостей документа:
{карта_из_шага_1}

Разделы для правки и их зависимости:
{затронутые_разделы}

Задача: {описание_правки}

Требования:
- Внеси изменение в целевой раздел
- Проверь все зависимые разделы на согласованность
- Выведи: обновлённые тексты | что изменил | что требует ручной проверки
📌

Шаг 3: Проверка согласованности

После правки проверь согласованность документа.

Что изменилось: {список_изменений}
Карта зависимостей: {карта}

Проверь:
1. Все ли явные ссылки из изменённых разделов остаются корректными?
2. Не разъехалась ли терминология в зависимых разделах?
3. Не противоречат ли смысловые зависимости новой версии?

Выведи конкретный список проблем или подтверди согласованность.

Плейсхолдеры: - {документ} — вставь весь текст - {карта_из_шага_1} — результат первого шага - {затронутые_разделы} — только те части, которые меняются + зависимые из карты - {описание_правки} — что именно нужно изменить и зачем - {список_изменений} — краткое описание что поменял на шаге 2


🚀 Быстрый старт — вставь в чат:

Вот шаблон для работы с длинными документами — карта зависимостей 
и правка с проверкой согласованности. Адаптируй под мою задачу: 
{твоя задача — например, «обновить оффер» или «отредактировать договор»}.
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит про структуру документа и характер правки — потому что карта зависимостей строится под конкретный тип документа (оффер, договор, инструкция, статья), и от этого зависит что считать «зависимостью».


⚠️

Ограничения

⚠️ Структурная реорганизация: LEDGER показывает только 54% согласованности при перестановке разделов, переименовании или изменении иерархии. Это самый сложный сценарий — каскадный. В чате: если двигаешь блоки местами, карту придётся перестраивать заново.

⚠️ Требует ручного ведения карты: в отличие от системы LEDGER, ты обновляешь карту сам после каждой итерации. Для коротких документов (до 5-7 разделов) и разовых правок это избыточно.

⚠️ Карта устаревает: если вносишь последовательные правки без обновления карты, зависимости начинают врать. Лучший подход: пересоздавать карту раз в несколько итераций.

⚠️ Неявные смысловые зависимости: LLM находит явные ссылки хорошо, смысловые — хуже. В маркетинговых текстах, где логика строится на эмоциях и нарративе, часть связей останется неуловленной.


🔗

Ресурсы

LEDGER: Scaling Agentic Document Editing with Dependency-aware Graph Retrieval

Mike Hang Wang, Utkarsh Garg, Reza Davari, Huitian Jiao, Hao Cheng, Baolin Peng, Si-Qing Chen, Tao Ge

Microsoft Research

Связанные направления: ChatGPT Canvas, Agent Mode in Word (Microsoft)


📋 Дайджест исследования

Ключевая суть

Модель на максимальной мощности рассуждений без карты проигрывает той же модели на простых настройках — но с явной картой зависимостей: 56% против 76% согласованности. Метод LEDGER позволяет редактировать длинные структурированные документы так, чтобы правка одной части не разваливала логику остальных. Перед правкой строишь карту: кто на кого ссылается, что от чего зависит по смыслу — и модель получает не весь документ, а только нужный отрывок плюс все связанные с ним части. Поменял термин в разделе 3 — модель сама видит, что раздел 7 теперь противоречит обещанию из раздела 2.

Принцип работы

Стандартный подход — скормить модели весь документ и попросить поправить нужное. Это не работает: внимание модели размазывается по длинному тексту, важные связи тонут. Карта переводит невидимые зависимости в явные инструкции — и модель перестаёт угадывать, что затронет правка. Три шага: сначала строишь карту (один промпт), потом правишь с явным контекстом только затронутых и зависимых разделов (второй промпт), потом проверяешь что не разъехалось (третий). Модель не умнеет — она просто перестаёт работать вслепую.

Почему работает

LLM не держит в голове структурные связи документа. Это не баг — особенность: чем длиннее текст, тем сильнее внимание «размазывается», и связь между разделом 2 и разделом 9 просто теряется. Но модель отлично следует явным инструкциям. Главный вывод исследования: проблема была не в недостатке «ума» модели, а в отсутствии структурной информации. Дай явную карту — и простая модель обгоняет усиленную без карты. Это значит, что включать расширенный анализ для редактуры документов — выбрасывать деньги и время. Достаточно карты.

Когда применять

Длинные структурированные документы — офферы, договоры, технические задания, инструкции, лонгриды, исследовательские отчёты — особенно когда один и тот же термин, обещание или ссылка встречаются в нескольких разделах. Идеально для итеративной правки: меняешь позиционирование, обновляешь условия, переформулируешь ключевой тезис. НЕ подходит для: разовой правки одного-двух абзацев короткого текста (три шага избыточны) и для полной реорганизации структуры — перестановки разделов местами (согласованность у самой системы падает до 54%, карту придётся пересобирать заново).

Мини-рецепт

1. Построй карту одним промптом: передай весь документ и попроси для каждого раздела указать явные ссылки (на таблицы, рисунки, другие разделы), смысловые зависимости (какие утверждения из других частей необходимы для понимания) и сквозные термины. Формат вывода: [Раздел] → явные ссылки: [...] | зависит от: [...] | термины: [...]

2. Правь с контекстом, не с полным документом: передай карту из шага 1 плюс только затронутый раздел и все зависимые из карты. Попроси внести изменение, проверить зависимые разделы на согласованность, вывести что изменил и что требует ручной проверки.

3. Проверяй согласованность отдельно: после правки передай список изменений и карту. Попроси проверить: корректны ли явные ссылки, не разъехалась ли терминология, не противоречат ли смысловые зависимости новой версии.

4. Обновляй карту при серьёзных правках: если изменения затронули структуру или ввели новые термины — пересобери карту заново перед следующей итерацией. Устаревшая карта хуже отсутствия карты.

Примеры

[ПЛОХО] : Перепиши раздел 3 оффера — замени фокус с «экономия времени» на «рост выручки»
[ХОРОШО] : Шаг 1 — Проанализируй документ и построй карту зависимостей. Для каждого раздела: явные ссылки на другие блоки, смысловые зависимости (какие обещания из других разделов нужны для понимания этого), сквозные термины. Формат: [Раздел] → явные ссылки: [...] | зависит от: [...] | термины: [...]. Документ: [вставить] Шаг 2 — Карта зависимостей: [результат шага 1]. Разделы для правки и их зависимости: [раздел 3 + все зависимые из карты]. Задача: замени фокус с «экономия времени» на «рост выручки» в разделе 3. Проверь зависимые разделы. Выведи: обновлённые тексты | что изменил | что проверить вручную
Источник: LEDGER: Scaling Agentic Document Editing with Dependency-aware Graph Retrieval
ArXiv ID: 2606.28379 | Сгенерировано: 2026-06-30 04:34

Проблемы LLM

ПроблемаСутьКак обойти
Правка длинного документа разрушает скрытые связиМеняешь термин в одном разделе. Модель правит его хорошо. Но не замечает, что три других раздела опираются на старый смысл. Чем длиннее документ, тем хуже: внимание размазывается, связи теряются. Итог — документ противоречит сам себеПеред правкой явно построй карту зависимостей. Какой раздел на что ссылается. Что от чего зависит по смыслу. Передай модели только изменяемый отрывок плюс все зависимые части

Методы

МетодСуть
Три шага при правке длинного документаШаг 1 — карта зависимостей. Попроси модель: «Для каждого раздела укажи явные ссылки, смысловые зависимости, сквозные термины». Формат: [Раздел] ссылается на: [...] | зависит от: [...] | термины: [...]. Шаг 2 — правка. Передай только затрагиваемый отрывок плюс зависимые из карты. Не весь документ. Шаг 3 — проверка. Покажи модели список изменений и карту. Попроси: «Не сломались ли ссылки? Не разъехалась ли терминология?». Почему работает: карта делает невидимые связи видимыми. Модель не держит их сама — но отлично следует явным инструкциям. Когда не нужно: документы до 5–7 разделов и разовые правки. Осторожно: при перестановке разделов карту нужно пересоздавать заново
📖 Простыми словами

LEDGER: ScalingAgenticDocument Editing with Dependency-aware Graph Retrieval

arXiv: 2606.28379

Редактирование длинных документов через нейронки — это всегда прогулка по минному полю, где главной проблемой становится каскадный обвал логики. Когда ты просишь LLM поправить один абзац, она делает это блестяще, но напрочь забывает, что этот текст был фундаментом для выводов в конце документа. В итоге получается классическая ситуация: в начале статьи мы «экономим время», а в конце внезапно «растим выручку», и читатель не понимает, в какой момент его начали обманывать. LEDGER меняет правила игры, внедряя карту зависимостей, которая буквально привязывает смысловые блоки друг к другу, не давая модели терять нить повествования.

Это похоже на ремонт в старой хрущевке: ты решил просто передвинуть одну стену, но внезапно выясняется, что на ней держалась проводка соседа, общая вентиляция и надежда всего подъезда на тишину. Формально стена стоит красиво, но весь дом теперь функционирует через одно место. LEDGER работает как продвинутый инженерный план, который заранее подсвечивает: «Тронешь этот кирпич — посыплется крыша в другом крыле». Вместо того чтобы слепо менять текст, система сначала строит граф связей, понимая, какой раздел является «донором» смысла, а какой — «реципиентом».

В основе метода лежит Dependency-aware Graph Retrieval — это когда нейронка не просто ищет похожие куски текста, а видит иерархию. Если ты меняешь описание продукта в оффере, система автоматически вытягивает из памяти блоки с ценами, FAQ и гарантиями, потому что они логически зависят от основного позиционирования. Это не просто поиск по ключевым словам, а работа со структурой: модель видит, что изменение в пункте А обязано повлечь за собой правки в пунктах Б и В, иначе документ превратится в бессвязную кашу.

Хотя тестировали это на сложных документах, принцип универсален для любой работы с контентом, будь то техническая документация, сценарии или бизнес-планы. Везде, где объем текста превышает пару экранов, обычная LLM начинает «плыть», потому что её окно внимания ограничено. LEDGER превращает редактирование из лотереи в контролируемый процесс, где целостность документа стоит выше локальной красоты фразы. Это переход от простого исправления ошибок к полноценному инженерному подходу в копирайтинге.

Короче: хватит надеяться, что нейронка сама «всё поймет» и ничего не сломает в длинном тексте — она обязательно сломает. Нужно использовать инструменты, которые видят структурные связи, а не просто поток слов. LEDGER доказывает, что контроль зависимостей — это единственный способ масштабировать работу AI-агентов без потери качества. Кто научится управлять этими связями, тот сможет собирать сложные документы за минуты, пока остальные будут вручную вылавливать логические дыры в своих текстах.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с