3,583 papers
arXiv:2604.17072 74 18 апр. 2026 г. FREE

CogGen: рекурсивный цикл «план → пиши → пересмотри» для глубоких аналитических отчётов

КЛЮЧЕВАЯ СУТЬ
К седьмому разделу модель «забывает» первый — он уже далеко в контексте, его вес упал. Отсюда классика длинных отчётов: введение говорит одно, выводы — другое. CogGen позволяет писать многораздельные отчёты, где логика не рассыпается к финалу. Фишка: правки вносятся не в текст напрямую, а в структурный план — после того как рецензент прочитал весь черновик целиком. Обновили план → перегенерировали проблемные разделы. Без латания и новых швов.
Адаптировать под запрос

TL;DR

CogGen — техника рекурсивной генерации отчётов, которая ломает линейный сценарий «написал раздел 1, написал раздел 2, не вернулся». Вместо этого: сначала глобальный план, потом черновик всех разделов, потом ревью всего отчёта целиком, потом пересмотр плана — и снова по кругу, пока структура не станет логически связной.

Главная боль — LLM пишет отчёты «от начала к концу», не оглядываясь назад. Попросил написать анализ рынка на 10 разделов — и к разделу 7 модель находит данные, которые ломают логику раздела 2. Но раздел 2 уже написан. В итоге отчёт, где каждый абзац неплохой, но целое не держится: противоречия, повторы, вывод не вытекает из вступления.

Решение — два вложенных цикла. Макро-цикл: создать план → написать все разделы → провести глобальный ревью → пересмотреть план → переписать. Микро-цикл: для каждого раздела внутри — собрать информацию → скорректировать план раздела → написать → проверить. Точка пересмотра — после того как виден весь черновик целиком, не до.


🔬

Схема метода

МАКРО-ЦИКЛ (несколько запросов в чат):
ШАГ 1 → Planner: поиск информации + создать outline → outline O(0)
ШАГ 2 → Writer: написать все разделы по outline → черновик C(t)
ШАГ 3 → Reviewer: оценить ВЕСЬ черновик целиком → список проблем Δ(t)
         └─ Улучшение есть? → перейти к ШАГ 4
         └─ Нет? → принять черновик, перейти к визуалу
ШАГ 4 → Planner: пересмотреть outline с учётом Δ(t) → outline O(t+1)
         └─ вернуться к ШАГ 2

МИКРО-ЦИКЛ (внутри ШАГ 2, для каждого раздела):
  → Поиск по теме раздела
  → Скорректировать план раздела (если нужно)
  → Написать раздел
  → Проверить на соответствие глобальному outline

ВИЗУАЛ (Abstract Visual Representation — параллельно с написанием):
  → Writer описывает намерение: [что показать | зачем | какие данные]
  → Render Agent (отдельный шаг) переводит в код/график

Все шаги выполняются в отдельных запросах в чате. Parallelism из статьи — только в автоматизированной системе; вручную — последовательно.


🚀

Пример применения

Задача: Написать аналитический отчёт «Рынок подписок на стриминг в России: Kion, Okko, START, Wink» — для питча инвестору. Нужны данные, логика, визуализации.

Промпт (3 отдельных запроса):

Запрос 1 — план:

Ты — аналитик, которому нужно написать инвестиционный отчёт 
«Рынок видеостриминга в России 2024–2025».

ЭТАП 1 — ПЛАН
Создай структуру отчёта:
- 6–8 разделов
- для каждого раздела: ключевой вопрос, который он закрывает
- для каждого раздела: 2–3 тезиса, которые нужно доказать

Выведи только план. Не начинай писать текст.

Запрос 2 — черновик:

Вот план отчёта: [вставить план из шага 1]

ЭТАП 2 — ЧЕРНОВИК
Напиши каждый раздел по плану.
В конце каждого раздела добавь маркер: [РАЗДЕЛ ЗАВЕРШЁН: название]

Для каждого графика или таблицы — не пиши код.
Опиши намерение в формате:
[ВИЗУАЛ | тип: bar chart / line / table | показывает: ... | 
 зачем: какой вывод поддерживает | данные: откуда взять]

Запрос 3 — глобальный ревью и пересмотр:

Вот черновик отчёта: [вставить черновик]

ЭТАП 3 — ГЛОБАЛЬНЫЙ ПЕРЕСМОТР
Проверь отчёт целиком:
1. Логически ли связан отчёт? Вывод вытекает из данных?
2. Есть ли разделы, которые противоречат друг другу?
3. Есть ли информация из поздних разделов, которая требует 
   пересмотра ранних?
4. Нужно ли переструктурировать? Если да — предложи новый plan.

Выдай: список проблем + новый outline (если нужен).

Если глобальная структура изменилась — напиши финальную версию 
отчёта с новым планом.

Результат: Первые два запроса дадут черновик с маркерами [РАЗДЕЛ ЗАВЕРШЁН] и описаниями визуалов в формате AVR. Третий запрос — либо подтверждение что структура держится, либо конкретный список противоречий (раздел про монетизацию противоречит данным про аудиторию) плюс предложение переструктурировать. При переработке модель видит весь черновик целиком и уже может выстроить связную логику от первого раздела до вывода.


🧠

Почему это работает

Слабость LLM — модель генерирует текст последовательно и не может «вернуться назад». Когда пишет раздел 6, она больше не «помнит» намерение раздела 2. В итоге за длинный отчёт контекст «уплывает», а структура рассыпается. Это не баг, это архитектура: модель предсказывает следующий токен, а не перечитывает написанное по-человечески.

Сильная сторона LLM — модель отлично оценивает и критикует готовый текст. Если показать ей весь черновик целиком и спросить «где противоречия?» — она найдёт. Ревью чужого или «своего готового» текста работает намного лучше, чем одновременное создание и контроль качества.

Как метод использует это — CogGen прерывает линейный процесс принудительной «точкой остановки». После полного черновика включается ревью с глобальной перспективой — модель видит отчёт как единое целое. Обнаруженные противоречия идут не в правку отдельных разделов, а в пересмотр плана. Правится архитектура, а не текст — это и даёт логическую связность.

Рычаги управления: - Число итераций макро-цикла → 1-2 для средних отчётов, 3-4 для глубоких многотемных анализов - Критерии ревью → замени стандартные («логическая связность, противоречия») на специфические под задачу («инвестиционная убедительность», «соответствие регуляторной рамке») - Детальность плана раздела → больше тезисов в outline = меньше пространства для «ухода в сторону» при написании - AVR-формат → описывай визуализации на этапе плана, а не после — это помогает модели писать текст с расчётом на визуал


📋

Шаблон промпта

Ты — {роль: аналитик / стратег / эксперт в области {домен}}.

Задача: написать {тип_документа} по теме «{тема}».

═══ ЭТАП 1: ПЛАН ═══
Создай структуру документа:
- {число_разделов} разделов
- Для каждого: ключевой вопрос раздела
- Для каждого: 2–3 тезиса, которые раздел должен доказать
- Укажи: какие данные/факты потребуются для каждого раздела

Только план. Не начинай писать текст.

---

[После получения плана — следующий запрос]

═══ ЭТАП 2: ЧЕРНОВИК ═══
Вот план: {вставить план}

Напиши каждый раздел по плану.
Маркер в конце каждого раздела: [РАЗДЕЛ: {название} — ЗАВЕРШЁН]

Для каждого визуального элемента (графики, таблицы, схемы):
НЕ пиши код. Используй формат намерения:
[ВИЗУАЛ | тип: {bar/line/table/pie} | 
 показывает: {что} | 
 вывод который поддерживает: {зачем} |
 источник данных: {откуда}]

---

[После получения черновика — следующий запрос]

═══ ЭТАП 3: ГЛОБАЛЬНЫЙ РЕВЬЮ ═══
Вот черновик: {вставить черновик}

Оцени документ целиком по критериям:
1. Логика: вывод вытекает из данных первых разделов?
2. Противоречия: есть ли разделы, которые опровергают друг друга?
3. Пересмотр структуры: требует ли информация из поздних разделов 
   изменить логику ранних?
4. Критерий {специфический для задачи: убедительность для инвестора /
   соответствие ТЗ / фактическая точность}

Выдай:
- Список найденных проблем
- Предложение нового плана (если структура требует пересмотра)
- Да/нет: нужна ли переработка?

Если да — напиши финальную версию с исправленной структурой.

Плейсхолдеры: - {роль} — аналитик рынка, маркетолог, юрист, стратег - {тип_документа} — аналитический отчёт, инвестиционное резюме, конкурентный анализ - {тема} — конкретная тема со сферой и географией - {число_разделов} — 5–8 для развёрнутого анализа - {специфический критерий} — подстрой под получателя документа


🚀 Быстрый старт — вставь в чат:

Вот шаблон рекурсивного написания отчёта по методу CogGen. 
Адаптируй под мою задачу и задай уточняющие вопросы.

[вставить шаблон выше]

LLM спросит тему, тип документа, роль эксперта и получателя отчёта — потому что без этого нельзя создать осмысленный план и задать правильные критерии ревью. Она возьмёт трёхэтапную структуру и заполнит под твою задачу.


⚠️

Ограничения

⚠️ Короткие задачи: Для текстов до 2-3 разделов метод избыточен. Трёхэтапный цикл оправдан только для объёмных документов с 5+ разделами и перекрёстными зависимостями.

⚠️ Качество ревью зависит от критериев: Если в ЭТАПЕ 3 не указать конкретные критерии — модель даёт общие замечания вместо структурных. Потрать время на формулировку критериев под задачу.

⚠️ Параллельность недоступна вручную: В оригинальной системе все разделы пишутся одновременно. В ручном режиме — последовательно. Для больших отчётов (10+ разделов) это медленно.

⚠️ Полное воспроизведение требует кода: Оригинальная система — автоматизированный multi-agent pipeline с оркестрацией через API. Шаблон выше — ручная адаптация принципов, а не полный CogGen.

⚠️ Визуальный рендеринг — отдельная задача: AVR-описания нужно отдельно конвертировать в код (в том же чате, в Code Interpreter или через отдельный инструмент).


🔗

Ресурсы

Работа: CogGen: A Cognitively Inspired Recursive Framework for Deep Research Report Generation

GitHub: https://github.com/NJUNLP/CogGen

Теоретическая база: - Cognitive Process Theory of Writing (Flower & Hayes, 1981; Hayes, 1996) - Cognitive Load Theory (Sweller, 1994) - Cognitive Theory of Multimedia Learning (Mayer, 2005) - Cognitive Offloading (Risko & Gilbert, 2016)

Авторы: Kuo Tian, Pengfei Sun, Zhen Wu, Junran Ding, Xinyu Dai

Университет: National Key Laboratory for Novel Software Technology, Nanjing University, China; Nanjing Haodun Technology Development Co., Ltd.


📋 Дайджест исследования

Ключевая суть

К седьмому разделу модель «забывает» первый — он уже далеко в контексте, его вес упал. Отсюда классика длинных отчётов: введение говорит одно, выводы — другое. CogGen позволяет писать многораздельные отчёты, где логика не рассыпается к финалу. Фишка: правки вносятся не в текст напрямую, а в структурный план — после того как рецензент прочитал весь черновик целиком. Обновили план → перегенерировали проблемные разделы. Без латания и новых швов.

Принцип работы

Не редактируй абзацы — обновляй план. Локальная правка создаёт новые противоречия. Обновлённый план перегенерирует раздел с нуля — чисто. Цикл: создай структуру → пиши раздел за разделом → прочитай весь черновик → найди противоречия → обнови план → перепиши проблемные части → повтори. Внутри каждого раздела — своя маленькая петля: что мне известно? нужно ли скорректировать структуру раздела? теперь пиши. Модель сначала собирает данные, потом решает как строить раздел, потом пишет. Это микроцикл — не даёт писать вслепую.

Почему работает

Модель генерирует текст слева направо, токен за токеном. Написала раздел 7 — раздел 1 уже далеко. Его вес в контексте снизился. Противоречия между началом и концом — не небрежность. Это архитектура. Но у модели есть сильная сторона: рецензировать готовый текст она умеет. Замечает нелогичные переходы, противоречия между тезисами, разделы которые тянут в разные стороны. Задача «напиши» и задача «найди противоречие» — разные режимы. Генерация идёт без остановок, рецензия требует взгляда на всё сразу. CogGen просто разделяет их явно — и это меняет результат.

Когда применять

Для любого длинного документа в чате — аналитические разборы, рыночные исследования, стратегические материалы, питч-документы — особенно когда разделов больше 4–5 и логика должна вести читателя от начала к концу без разрывов. НЕ подходит для: коротких текстов до 3 разделов (проще линейно), материалов где каждый раздел независим (сборники советов, FAQ), срочных задач где нет времени на несколько итераций в чате.

Мини-рецепт

1. Создай живую структуру: попроси модель написать план с ключевым вопросом для каждого раздела. Не «список тем» — а «что этот раздел должен доказать».

2. Пиши раздел за разделом: для каждого сначала спроси — что известно по теме? нужно ли скорректировать структуру раздела? — и только потом «пиши».

3. Стоп после полного черновика: попроси прочитать весь текст целиком. Вопрос: где выводы поздних разделов меняют логику ранних? Где разделы тянут в разные стороны?

4. Обнови план, не текст: рецензент выдаёт правки в структуру. Потом перегенерируй только проблемные разделы с учётом обновлённого плана.

5. Оцени по CLEF: Организация (легко ли двигаться между разделами), Глубина (есть ли причины, не только факты), Релевантность (соответствует ли сложность цели отчёта), Согласованность (таблицы и схемы совпадают с текстом рядом), Синергия (визуал дополняет текст, а не дублирует).

Примеры

[ПЛОХО] : Напиши подробный отчёт о рынке корпоративного обучения в России: история, объём, игроки, тренды, прогноз
[ХОРОШО] : Напиши отчёт о рынке корпоративного обучения в России для питча инвесторам. Шаг 1 — Глобальный план: создай структуру с ключевым вопросом каждого раздела. Это живой документ — обновим после написания. Шаг 2 — Разделы: для каждого — что тебе известно? нужно ли скорректировать структуру раздела? — потом пиши. Шаг 3 — Рецензия: прочитай весь черновик. Где поздние выводы меняют логику ранних? Где разделы противоречат друг другу? Как обновить план? Не исправляй локально — пересматривай структуру глобально. Шаг 4 — Переработка: перепиши проблемные разделы с учётом обновлённого плана. Шаг 5 — Оценка по CLEF: организация, глубина, релевантность, согласованность, синергия — конкретные замечания, не «хорошо».
Источник: CogGen: A Cognitively Inspired Recursive Framework for Deep Research Report Generation
ArXiv ID: 2604.17072 | Сгенерировано: 2026-04-21 05:51

Проблемы LLM

ПроблемаСутьКак обойти
Модель теряет связь между началом и концом длинного текстаМодель пишет токен за токеном слева направо. Когда пишет раздел 7 — раздел 1 уже далеко в контексте. Его вес снизился. Модель не «помнит» его так же остро. Вывод в конце противоречит тезису в начале. При этом модель не остановится и не оглянется — нет явной точки для этогоВставь принудительную остановку после полного черновика. Попроси прочитать весь текст целиком и найти противоречия между разделами. Потом обнови структуру — и только из обновлённой структуры перепиши проблемные части

Методы

МетодСуть
Рекурсивный план пиши пересмотриРаботает в 4 шага. Шаг 1: создай структуру отчёта с вопросом для каждого раздела. Шаг 2: пиши каждый раздел поочерёдно. Шаг 3: прочитай весь черновик. Явно спроси: «Где выводы поздних разделов меняют логику ранних? Где разделы противоречат?» Обнови глобальную структуру. Шаг 4: перепиши проблемные разделы из обновлённой структуры. Почему работает: модель хорошо рецензирует готовый текст. Плохо удерживает согласованность при длинной генерации. Метод использует сильную сторону — рецензирование — и компенсирует слабую. Важно: исправляй структуру, не абзацы. Точечная правка абзаца часто создаёт новое противоречие в другом месте. Когда применять: отчёт от 4 разделов, аналитика, стратегический документ. Для коротких текстов (до 3 разделов) проще работать линейно

Тезисы

ТезисКомментарий
Модель лучше рецензирует, чем удерживает согласованность при написанииГенерация и рецензирование — разные режимы. При написании модель движется вперёд и не оглядывается. При рецензировании читает текст целиком и замечает логические несоответствия, противоречия между разделами, повторы. Это не баг — это разница между двумя задачами. Применяй: не проси модель «написать хорошо с первого раза». Проси написать черновик — потом отдельным запросом рецензировать его как целое
📖 Простыми словами

CogGen: A Cognitively Inspired Recursive Framework for Deep Research Report Generation

arXiv: 2604.17072

Нейросети пишут длинные тексты как пьяный рассказчик: бодро начинают, но к середине забывают, о чем была завязка, а в конце вообще уходят в дебри. Это происходит потому, что LLM генерируют токены последовательно — они не могут «отмотать назад» и поправить логику в первом абзаце, если в пятом она посыпалась. CogGen решает эту проблему через рекурсивную генерацию, заставляя модель работать не линейно, а циклами: план, черновик, жесткое ревью всего полотна и переписывание структуры заново.

Это как если бы ты писал диплом не по принципу «сдал и забыл», а постоянно возвращался к введению после каждой написанной главы. Обычно автор-новичок просто лепит куски текста друг за другом, надеясь, что в конце всё как-нибудь склеится. CogGen — это дотошный главред, который после каждой страницы заставляет тебя перечитывать весь талмуд целиком, находить логические дыры и перекраивать оглавление, чтобы аргументы в конце не противоречили началу.

В основе метода лежат три кита: глобальное планирование, итеративное уточнение и динамическая корректировка. Сначала модель набрасывает скелет, потом заливает его «мясом» текста, но на этом не останавливается. Она делает zoom-out, смотрит на отчет со стороны и спрашивает себя: «А не фигню ли я написал в разделе про Kion, если в выводах у меня лидирует Wink?». Если находит косяк — она не просто правит предложение, а пересобирает план и переписывает проблемные зоны, пока картинка не станет цельной.

Метод тестировали на сложных аналитических отчетах, но принцип универсален для любой объемной работы: от написания бизнес-стратегий до создания лора для компьютерных игр. Везде, где важна внутренняя непротиворечивость и длинная логическая цепочка, обычный промпт выдаст кашу, а рекурсивный подход — структуру. Это переход от простого «напиши мне текст» к полноценному проектированию контента, где качество важнее скорости.

Короче, эпоха «простыней текста» от нейронок заканчивается, потому что читать их невозможно. CogGen доказывает, что для крутого результата модели нужно дать возможность ошибаться и исправляться. Если хочешь получить отчет, который не стыдно показать инвестору, забудь про линейную генерацию. Рекурсия и постоянное ревью — единственный способ заставить AI выдавать не просто набор слов, а связную и глубокую аналитику.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с