3,583 papers
arXiv:2606.30524 74 29 июня 2026 г. FREE

Dev-Plan принцип: человек планирует — AI исполняет

КЛЮЧЕВАЯ СУТЬ
Парадокс: сложная цепочка специализированных агентов — с ролями, разделением труда и координацией — стабильно проигрывает простому гибриду. Тому, где структуру задаёшь ты, а AI просто заполняет разделы. Метод позволяет получить документ с реальной глубиной вместо шаблонного текста с «быстрорастущим рынком» и «уникальным предложением». Схема простая: ты пишешь нумерованный список разделов — AI проходит по каждому. Вся мощность уходит в содержание, а не в планирование.
Адаптировать под запрос

TL;DR

LLM плохо планирует, но отлично исполняет. Это исследование сравнило три подхода к созданию документации: один большой промпт, цепочка специализированных агентов и гибрид — когда человек задаёт структуру, а AI её заполняет. Победил гибрид.

Главная находка: узкое место сложных AI-систем — это автономное планирование. Когда AI сам решает «что писать и в каком порядке» — он генерирует шаблонные, предсказуемые планы. Из этого вырастают посредственные тексты: формально правильные, но без глубины и специфики. Это та самая боль, когда просишь ChatGPT «напиши подробный отчёт» — и получаешь общие разделы с водой вместо конкретики.

Решение простое: отними у AI функцию планирования — оставь ему только исполнение. Ты задаёшь структуру и порядок разделов, AI заполняет каждый. Результат стабильно лучше, чем когда AI всё делает сам — даже если этот «сам» реализован через сложную систему агентов.


🔬

Схема метода

ШАГ 1 (ТЫ): Составь структуру документа — список разделов 
             в нужном порядке → JSON-план или просто нумерованный список

ШАГ 2 (AI): Для каждого раздела — отдельный запрос с контекстом
             → черновик раздела

ШАГ 3 (AI): Проверка и сшивка → финальный документ

Один промпт или несколько — зависит от длины документа.
Для коротких задач (до 1000 слов) — одним промптом со структурой.
Для длинных — по разделу за запрос.

🚀

Пример применения

Задача: Написать инвестиционный меморандум для стартапа — сервиса доставки лекарств из аптек за 30 минут. Презентация для фонда Альфа-Групп.

Что обычно делают: «ChatGPT, напиши инвестиционный меморандум для стартапа по доставке лекарств»

Что получают: Стандартная структура о «быстрорастущем рынке», «уникальном предложении» и «опытной команде». Ноль специфики.

Промпт по Dev-Plan принципу:

Напиши инвестиционный меморандум для стартапа «АптекаРядом» 
(доставка лекарств за 30 минут в Москве).

Структура — строго в этом порядке:
1. Проблема — почему люди не могут ждать доставку лекарств сутки
2. Решение — как работает сервис технически (партнёрства, маршрутизация)
3. Рынок — объём рынка аптечного ритейла РФ, CAGR, доля онлайн
4. Бизнес-модель — откуда деньги (маржа с аптек, подписка, реклама)
5. Трекшн — текущие метрики: GMV, кол-во заказов/день, NPS
6. Конкуренты — Сбер Еаптека, Apteka.ru, Яндекс.Маркет Здоровье
7. Команда — ключевые люди и релевантный опыт
8. Финансовый запрос — сколько, на что, какой раунд

Для каждого раздела:
— Будь конкретным, избегай общих фраз типа "быстрорастущий рынок"
— Если нет данных — укажи [ДАННЫЕ НУЖНЫ] и объясни почему это важно
— Объём каждого раздела: 3-5 предложений

Начинай с раздела 1.

Результат: Модель пройдёт по каждому разделу строго в указанном порядке. Там где не хватает данных — поставит явные метки [ДАННЫЕ НУЖНЫ] вместо того чтобы выдумывать. Финальный текст будет структурно полным — ни один важный раздел не выпадет. Тон будет специфичным для фармацевтического рынка, а не шаблонным «стартап-спичем».


🧠

Почему это работает

LLM плохо держит в голове «что ещё не написано». Когда ты просишь написать длинный документ одним запросом — модель генерирует текст последовательно, слова за словами. Она не «видит» документ целиком. Поэтому одни разделы получаются раздутыми, другие — выпадают совсем. Это не баг, это природа авторегрессивной генерации.

Зато LLM отлично заполняет заданный контейнер. Когда структура уже есть — модели не нужно тратить «мощность» на планирование. Вся энергия идёт в качество содержания конкретного раздела. Это как разница между «сочини план и напиши эссе» против «вот план — напиши эссе».

Рычаги управления: - Объём раздела — укажи лимит в словах или предложениях → предотвращает «воду» - Метка для пропусков — попроси ставить [НУЖНЫ ДАННЫЕ] → получишь честный документ, не выдуманные цифры - Стиль раздела — для каждого раздела можно указать разные требования: «раздел 3 — только цифры», «раздел 7 — нарративный формат» - Итерация — после черновика попроси пройтись по каждому разделу и «ужесточить» формулировки


📋

Шаблон промпта

Напиши {тип документа} для {контекст/проект}.

Структура — строго в этом порядке:
1. {раздел_1} — {что должно быть внутри}
2. {раздел_2} — {что должно быть внутри}
3. {раздел_3} — {что должно быть внутри}
[добавь нужное количество разделов]

Для каждого раздела:
— {требование к стилю}
— {требование к объёму}
— Если данных нет — пиши [{метка}] и объясни что нужно

Начинай с раздела 1.

Что подставлять: - {тип документа} — отчёт, стратегия, техзадание, компред, питч - {контекст/проект} — конкретная компания, задача, продукт - {раздел_N} — твои разделы в правильном порядке (это ключевое) - {требование к стилю} — «только факты», «нарратив», «bullet-points» - {метка}НУЖНЫ ДАННЫЕ или ПРОВЕРИТЬ или УТОЧНИТЬ


🚀 Быстрый старт — вставь в чат:

Вот шаблон для написания документов с заданной структурой. 
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит тип документа, контекст и желаемые разделы — потому что именно структура разделов определяет качество финального текста. Она возьмёт паттерн из шаблона и соберёт промпт под твою задачу.


⚠️

Ограничения

⚠️ Структурная полнота vs. скорость: Если писать каждый раздел отдельным запросом — качество выше, но нужно больше времени и сообщений. Для коротких документов (до 1000 слов) достаточно одного промпта со структурой.

⚠️ Ты должен знать структуру: Метод работает только если ты сам понимаешь, какие разделы нужны. Если ты не знаешь структуру — попроси AI сначала предложить варианты структур, выбери и скорректируй, и только потом запускай исполнение.

⚠️ Не для коротких задач: Для ответа на простой вопрос или написания одного абзаца — избыточно. Метод даёт эффект на объёмных материалах: отчёты, стратегии, компреды, технические документы.

⚠️ Метод исследовался на генерации кода документации. Перенос на другие домены (маркетинг, юридические документы) — логичная экстраполяция, но не прямое доказательство.


🔍

Как исследовали

Команда из университета Л'Акуила взяла 180 реальных GitHub-репозиториев (Python, JavaScript, Go), созданных после августа 2025 года — специально чтобы исключить «утечку данных» (модели могли видеть эти репозитории в обучении). Все оригинальные README убрали и попросили три системы написать их заново: один большой промпт, цепочка из пяти агентов и гибрид с человеческим планом.

Оценивали двумя способами: автоматически через ROUGE и BERTScore (насколько текст похож на оригинал) и вручную — смотрели, все ли важные разделы есть. Это разумный дизайн: текстовое сходство и структурная полнота — разные вещи.

Самое неожиданное: один промпт выиграл у сложной системы агентов по качеству текста — и при этом использовал в 7 раз меньше токенов. Но структурно проиграл: автономные агенты включили нужные разделы в 98% случаев против 49% у одного промпта. Это объяснило почему обе оценки нужны — ROUGE видит одно, а человек другое.

Dev-Plan победил оба подхода: средняя оценка LLM-судьи 8.60 против 7.55 у агентов и 7.25 у одного промпта. Исследователи интерпретируют это однозначно: планирование — главная слабость автономных AI-систем. Когда человек берёт планирование на себя, пропадает первопричина деградации.


💡

Адаптации и экстраполяции

🔧 Двухходовка: сначала структура, потом исполнение

Если не знаешь оптимальную структуру — сделай два хода: 1. «Предложи 3 варианта структуры для {документ}. Объясни логику каждого» 2. Выбираешь и правишь структуру → запускаешь исполнение

Ты всё равно остаёшься архитектором — просто AI помогает с вариантами.

🔧 Явная инструкция по планированию

Если всё же хочешь одним запросом — добавь перед основным промптом:

Сначала составь структуру документа и покажи мне её. 
Жди моего подтверждения перед тем как писать.

Это не Dev-Plan, но ближе к нему: ты видишь план до исполнения и можешь скорректировать.


🔗

Ресурсы

Статья: "The Illusion of Agentic Complexity in README.md Generation: Evaluating Single-Agent vs. Multi-Agent RAG Systems"

Репликационный пакет: https://anonymous.4open.science/r/ML4SE-8268/README.md

Авторы: Abu Saleh, Tesfay Welegebreal Tesfay, Phuong T. Nguyen, Juri Di Rocco, Muhammad Umar Zeshan, Davide Di Ruscio

Университеты: University of L'Aquila (Италия), Åbo Akademi University (Финляндия)

Связанные работы: LARCH (Koreeda et al.), RMGenie, RepoAgent, MetaGPT, AutoGen


📋 Дайджест исследования

Ключевая суть

Парадокс: сложная цепочка специализированных агентов — с ролями, разделением труда и координацией — стабильно проигрывает простому гибриду. Тому, где структуру задаёшь ты, а AI просто заполняет разделы. Метод позволяет получить документ с реальной глубиной вместо шаблонного текста с «быстрорастущим рынком» и «уникальным предложением». Схема простая: ты пишешь нумерованный список разделов — AI проходит по каждому. Вся мощность уходит в содержание, а не в планирование.

Принцип работы

LLM пишет слово за словом. Она не «видит» документ целиком — такова природа авторегрессивной генерации, где каждый следующий токен зависит только от предыдущих. Просишь написать длинный отчёт одним запросом — одни разделы раздуваются, другие выпадают. Это не глупость модели, это её устройство. Дай модели контейнер для заполнения, не задачу для планирования. Когда ты уже расписал «раздел 3 — конкуренты», «раздел 4 — бизнес-модель» — модели не нужно гадать что важно и в каком порядке. Она просто заполняет.

Почему работает

Планирование и исполнение конкурируют за одну и ту же мощность модели. Когда AI сам решает «что писать и в каком порядке» — он тянется к предсказуемым, шаблонным планам. Это не баг, это следствие обучения на миллионах типовых документов: модель воспроизводит усреднённый паттерн. Когда структура уже задана — вся избыточная мощность идёт в качество содержания каждого раздела. Результат: текст с конкретикой, а не вода с правильными заголовками.

Когда применять

Длинные структурированные документы → отчёты, стратегии, технические задания, компреды, меморандумы — особенно когда важна глубина каждого раздела, а не просто «чтобы были все темы». НЕ подходит для: коротких задач (один абзац, простой вопрос) — там это избыточно. И для ситуаций когда сам не знаешь нужную структуру — тогда сначала попроси AI предложить несколько вариантов структур, выбери и скорректируй, и только потом запускай исполнение.

Мини-рецепт

1. Составь список разделов: нумерованный, в нужном порядке. Это самое важное — порядок определяет логику документа.
2. К каждому разделу добавь подсказку: что должно быть внутри («только цифры», «нарратив», «сравнение с конкурентами»).
3. Задай лимит: «3-5 предложений на раздел» — отсекает воду лучше любого «пиши кратко».
4. Добавь правило для пропусков: «если данных нет — пиши [НУЖНЫ ДАННЫЕ] и объясни почему это важно». Получишь честный черновик, а не выдуманные цифры.
5. Запусти: «начинай с раздела 1». Для длинных документов — запрашивай каждый раздел отдельным сообщением, качество выше.

Примеры

[ПЛОХО] : Напиши инвестиционный меморандум для стартапа по доставке лекарств
[ХОРОШО] : Напиши инвестиционный меморандум для «АптекаРядом» — доставка лекарств за 30 минут в Москве. Структура — строго в этом порядке: 1. Проблема — почему срочная доставка лекарств это боль, а не каприз 2. Решение — как работает сервис технически: партнёрства с аптеками, маршрутизация 3. Рынок — объём аптечного ритейла РФ, доля онлайн, темп роста 4. Бизнес-модель — откуда деньги: маржа с аптек, подписка, реклама 5. Конкуренты — Сбер Еаптека, Apteka.ru, чем мы лучше конкретно 6. Финансовый запрос — сколько, на что, какой раунд Для каждого раздела: 3-5 предложений, никаких общих фраз. Нет данных — пиши [НУЖНЫ ДАННЫЕ]. Начинай с раздела 1.
Источник: The Illusion of Agentic Complexity in README.md Generation: Evaluating Single-Agent vs. Multi-Agent RAG Systems
ArXiv ID: 2606.30524 | Сгенерировано: 2026-06-30 07:25

Проблемы LLM

ПроблемаСутьКак обойти
Модель неравномерно распределяет внимание в длинных документахПросишь написать большой документ. Модель генерирует слово за словом — она не «видит» документ целиком. Одни разделы раздуваются. Другие выпадают совсем. Это не случайность — это природа авторегрессивной генерации. Проявляется в любом длинном тексте: отчёты, стратегии, техзаданияЗадай структуру явно — список разделов с описанием что должно быть внутри каждого. Модель перестаёт «думать что писать» и концентрируется на содержании. Добавь явную метку для пропусков: «если данных нет — пиши [НУЖНЫ ДАННЫЕ]» — иначе модель заполнит пустоты выдуманными фактами

Методы

МетодСуть
Заданная структура — AI заполняетНапиши список разделов сам. Укажи что должно быть в каждом. Отдай AI только заполнение. Структура — строго в этом порядке: 1. {раздел} — {что внутри}. Почему работает: Когда структура дана, модель не тратит «мощность» на планирование. Вся энергия идёт в качество содержания конкретного раздела. Усиливающие приёмы: укажи лимит предложений на раздел — убирает воду. Попроси разные стили для разных разделов («только цифры», «нарратив»). Когда применять: документы от 500 слов, есть несколько смысловых блоков. Когда лишнее: короткий ответ, один абзац
📖 Простыми словами

The Illusion ofAgenticComplexity in README.md Generation: Evaluating Single-Agentvs. Multi-AgentRAG Systems

arXiv: 2606.30524

Проблема в том, что современные нейронки — это гениальные исполнители с памятью золотой рыбки. Когда ты просишь AI написать сложный документ целиком, он не планирует структуру, а просто вываливает слова одно за другим. В итоге получается каша: в начале модель полна энтузиазма и расписывает детали, а к середине выдыхается и забывает, о чем вообще шла речь. Это фундаментальный облом авторегрессионной генерации — модель видит только предыдущее слово, но не всю картину целиком.

Это как пытаться построить дом, просто укладывая кирпичи один на другой без чертежа. Ты вроде занят делом, но в итоге вместо коттеджа получается кривая башня, где кухня почему-то на чердаке, а туалет забыли вовсе. Формально кирпичи лежат ровно, но жить в этом нельзя. Исследование подтвердило: LLM лажает в планировании, и даже толпа «умных» агентов, спорящих друг с другом, не спасает ситуацию, а только плодит лишнюю суету.

В битве подходов победил гибридный метод, где человек берет на себя роль архитектора. Работает это так: ты задаешь жесткий каркас и структуру, а нейронка вгрызается в каждый конкретный блок. Вместо одного гигантского промпта или бесконечной перепалки агентов, мы используем модульную генерацию. Это дает предсказуемый результат: каждый раздел документа получается проработанным, а не «написанным на сдачу», потому что у модели перед глазами узкая задача, а не весь мир.

Хотя тестировали это на скучных README-файлах для кода, принцип универсален. Это касается написания инвестиционных меморандумов, сложных статей или бизнес-планов. Если ты хочешь, чтобы AI выдал что-то сложнее списка покупок, забудь про магическую кнопку «сделай всё красиво». Разделение ответственности — вот ключ: человек чертит границы, машина заполняет их контентом. SEO-копирайтинг и техническая документация теперь строятся именно так, иначе на выходе будет просто дорогой цифровой мусор.

Короче: хватит верить в сказки про «автономных агентов», которые сами всё придумают и сделают. Исследование четко говорит, что контроль структуры человеком бьет любую автоматизацию. Если хочешь качественный лонгрид, сначала построй скелет, а потом заставляй нейронку наращивать на него мясо по одному куску за раз. Кто продолжает пихать в ChatGPT промпты на три страницы, тот получает галлюцинации и воду вместо нормального результата.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с