3,583 papers
arXiv:2605.02168 72 4 мая 2026 г. FREE

Planner Matters: роль планировщика определяет качество сложных многошаговых задач

КЛЮЧЕВАЯ СУТЬ
По итогам экспериментов вышло странное: масштабирование только планировщика даёт такой же прирост, что и масштабирование всей системы целиком. Не исполнитель, не память — именно планировщик тянет на себе весь итог. Метод Planner Matters позволяет разбить любую длинную задачу на три явные роли — планировщик, исполнитель, память — и получить результат, который не теряет нить к середине. Фишка: исполнитель и память работают почти без инструкций. Всё решает то, насколько детально ты написал роль планировщика.
Адаптировать под запрос

TL;DR

Когда LLM выполняет длинную, многошаговую задачу — будь то веб-навигация, анализ или создание сложного документа — качество финального результата почти целиком определяется качеством планирования, а не точностью выполнения отдельных шагов. Это не интуиция — это эмпирический факт, установленный в ходе контролируемых экспериментов: масштабирование роли планировщика даёт такой же прирост, что и масштабирование всей системы целиком.

Типичная проблема: когда просишь LLM сделать что-то сложное одним запросом, она пытается одновременно держать в голове стратегию, выполнять конкретные действия и отслеживать прогресс. Это создаёт конфликт целей внутри одного ответа — модель либо теряет общую цель (делает правильные шаги, но не туда), либо теряет точность шагов (понимает куда идти, но ошибается в деталях).

Решение — явно разделить три роли в работе с LLM: планировщик (стратегия и подзадачи), актор (выполнение конкретного шага), менеджер памяти (отслеживание прогресса). Самый важный вывод исследования: роль планировщика заслуживает абсолютного большинства ваших усилий при составлении промпта — актор и память справляются даже при минимальных инструкциях.


🔬

Схема метода

Один цикл выполняется в одном или нескольких запросах:

ШАГ 1: ПЛАНИРОВЩИК
Получает: задача + текущий контекст + накопленная память
Делает: decompose задачи на подзадачи, выдаёт текущий фокус-шаг
Выводит: ПЛАН + ТЕКУЩИЙ ПОДЗАДАЧА

ШАГ 2: АКТОР
Получает: текущую подзадачу от планировщика
Делает: выполняет один конкретный шаг
Выводит: РЕЗУЛЬТАТ + обновлённое состояние

ШАГ 3: МЕНЕДЖЕР ПАМЯТИ
Получает: историю шагов + новый результат
Делает: фиксирует что сделано, что изменилось в понимании задачи
Выводит: ОБНОВЛЁННЫЙ КОНТЕКСТ → возвращается к планировщику

↺ Цикл повторяется до завершения задачи

Все три шага можно выполнять в одном чате, инструктируя модель явно переключаться между ролями. Или разбить на три отдельных запроса — особенно полезно для задач, где нужны реальные паузы и проверка результата.


🚀

Пример применения

Задача: Максим хочет написать экспертную колонку для VC.ru о том, почему большинство российских стартапов проваливают выход на B2B-рынок. У него есть 5 разрозненных наблюдений из опыта, нет структуры, нет понимания с чего начать.

Промпт:

Буду работать с тобой в три роли. Переключайся между ними явно, 
не смешивай в одном блоке.

═══ РОЛЬ 1: ПЛАНИРОВЩИК ═══
Проанализируй задачу и составь детальный план статьи. 
Раздели на конкретные смысловые блоки с логикой переходов. 
Объясни, какую главную мысль должен унести читатель после каждого блока.
Заверши раздел словами: "ПЛАН ГОТОВ. Подзадача для Актора: [что делать первым]"

═══ РОЛЬ 2: АКТОР ═══
Получив подзадачу — выполни только её. Один блок, полностью. 
Не планируй вперёд, не отвлекайся на другие разделы.
Заверши словами: "ШАГ ВЫПОЛНЕН. Передаю в Память."

═══ РОЛЬ 3: МЕНЕДЖЕР ПАМЯТИ ═══
Зафикисируй: что написано, что ещё осталось по плану, 
изменилось ли понимание задачи после написания этого блока.
Заверши словами: "ПАМЯТЬ ОБНОВЛЕНА. Возвращаю Планировщику."

Затем Планировщик уточняет план (если нужно) → Актор делает следующий шаг.

Задача: написать экспертную колонку для VC.ru "Почему российские B2B-стартапы 
не выходят на корпоративный рынок". Мои наблюдения:
1. Основатели боятся длинных циклов сделок и кончают деньги
2. Продукт делается под SMB, а продаётся как enterprise
3. Нет пилотных программ — сразу хотят годовой контракт
4. Игнорируют внутренних чемпионов (людей внутри клиента)
5. Ценообразование скопировано с SaaS-метрик, а не с ценности для бизнеса

Результат:

Модель покажет работу тремя явными блоками на каждом цикле. Планировщик разберёт 5 наблюдений, найдёт между ними логику и предложит структуру с тезисом и нарративом. Актор напишет первый раздел сфокусированно, не размазываясь. Менеджер памяти зафиксирует что сделано и обновит фокус для следующего шага. На выходе — последовательно написанная, логически связная статья, где каждый раздел знает своё место.


🧠

Почему это работает

Слабость LLM: модель генерирует текст последовательно, слева направо. Когда ей нужно одновременно держать стратегию и выполнять детали — она начинает «усреднять» между двумя целями. Результат: ни рыба, ни мясо. Это не баг, это архитектурная особенность — у модели нет отдельного «стратегического центра».

Сильная сторона LLM: модель отлично следует чётким инструкциям, когда у неё одна конкретная задача в фокусе. Попросить «напиши только этот абзац, про это, вот так» — намного эффективнее, чем «напиши всю статью хорошо».

Как метод использует это: разделение ролей убирает конфликт целей. Планировщик думает только про стратегию. Актор выполняет только один шаг. Менеджер памяти только фиксирует. Каждая роль получает узкую, однозначную задачу — и выполняет её хорошо.

Главный рычаг управления: вкладывайте 90% усилий в инструкцию для планировщика. Насколько детально он разбивает задачу, насколько ясно формулирует подзадачи — это определяет качество всего остального. Актора достаточно инструктировать минимально («выполни только эту подзадачу»). Память вообще работает почти без специальных инструкций.

Дополнительные рычаги: - Количество циклов → для простых задач один цикл; для сложных — позвольте планировщику перепланировать после каждого шага - Детализация планировщика → чем конкретнее формулировки подзадач, тем точнее работает актор - Явные маркеры переключения ("ПЛАН ГОТОВ", "ШАГ ВЫПОЛНЕН") → убирают размытость, модель чётче переключается между режимами - Память через резюме → попросите менеджер памяти писать в формате «сделано / осталось / изменения в понимании» — это даёт планировщику нужный контекст без лишнего шума


📋

Шаблон промпта

Работай в трёх ролях по очереди. Каждую роль — отдельным блоком с заголовком.

═══ ПЛАНИРОВЩИК ═══
Задача: {задача}
Контекст и ограничения: {что важно учесть}
Текущая память: {что уже сделано / пусто, если начало}

Составь или обнови план. Выдели конкретную подзадачу для следующего шага.
Заверши: "ПОДЗАДАЧА: [формулировка]"

═══ АКТОР ═══
Выполни только подзадачу от Планировщика. Не выходи за её рамки.
Заверши: "РЕЗУЛЬТАТ: [что сделано]"

═══ МЕНЕДЖЕР ПАМЯТИ ═══
Зафиксируй:
— Что выполнено
— Что осталось по плану  
— Что изменилось в понимании задачи

Заверши: "ОБНОВЛЁННЫЙ КОНТЕКСТ: [краткое резюме для Планировщика]"

Затем снова — Планировщик, с обновлённым контекстом.
Повторяй до завершения задачи.

Что подставлять: - {задача} — конкретная задача целиком, со всеми деталями - {что важно учесть} — ограничения, формат, аудитория, тон - {что уже сделано} — при первом запуске пишите «начинаем с нуля»


🚀 Быстрый старт — вставь в чат:

Вот шаблон трёхролевого подхода к сложным задачам (Planner-Actor-Memory). 
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит про задачу, ограничения и желаемый формат результата — потому что без этого планировщик не сможет правильно декомпозировать задачу. Она возьмёт паттерн из шаблона и адаптирует под твой контекст.


⚠️

Ограничения

⚠️ Для простых задач не нужен: Если задача выполняется за 1-2 шага — три роли только перегрузят ответ. Метод раскрывается на задачах с 5+ этапами и нелинейной логикой.

⚠️ Память деградирует при длинных чатах: Менеджер памяти ограничен контекстным окном. При очень длинных сессиях накопленный контекст вытесняет начальные инструкции. Решение — периодически просить модель сжать память до ключевых тезисов.

⚠️ Планировщик может ошибиться в декомпозиции: Если задача плохо описана, планировщик разобьёт её неверно — и актор будет чётко выполнять неправильный план. Инвестируйте в описание задачи для планировщика, не жалейте деталей.

⚠️ Полная система требует кода: В исследовании описана архитектура с оркестрацией через API, RL-дообучением планировщика и векторной памятью. В чате вы симулируете принцип, не воспроизводите систему — и это уже даёт значительный прирост качества.


🔗

Ресурсы

Planner Matters! An Efficient and Unbalanced Multi-agent Collaboration Framework for Long-horizon Planning Wenyi Wu, Sibo Zhu, Kun Zhou, Biwei Huang — University of California, San Diego GitHub · Project page


📋 Дайджест исследования

Ключевая суть

По итогам экспериментов вышло странное: масштабирование только планировщика даёт такой же прирост, что и масштабирование всей системы целиком. Не исполнитель, не память — именно планировщик тянет на себе весь итог. Метод Planner Matters позволяет разбить любую длинную задачу на три явные роли — планировщик, исполнитель, память — и получить результат, который не теряет нить к середине. Фишка: исполнитель и память работают почти без инструкций. Всё решает то, насколько детально ты написал роль планировщика.

Принцип работы

Обычная схема: один запрос — модель пытается и планировать, и делать одновременно. Это как попросить архитектора одной фразой «придумай план здания и прямо сейчас заложи фундамент». Модель усредняет между двумя целями — получается ни стратегии, ни точности. Три роли — три разных фокуса. Планировщик думает только про стратегию и декомпозицию. Исполнитель делает один конкретный шаг. Память фиксирует что изменилось и передаёт контекст дальше. Разнесение ролей убирает конфликт целей. Каждая роль получает одну узкую задачу — и выполняет её хорошо. Неравный вклад — это не случайность. Планировщику нужны детальные инструкции: контекст, ограничения, логика декомпозиции, желаемый формат. Исполнителю достаточно «выполни только эту подзадачу, не выходи за рамки». Память работает почти без специальных указаний.

Почему работает

LLM генерирует текст последовательно — слева направо, токен за токеном. Нет отдельного «стратегического центра». Когда в одном запросе стоят две цели, модель начинает усреднять между ними. Правильные шаги — но не в ту сторону. Или правильное направление — но ошибки в деталях. Разделение ролей убирает это усреднение. Каждый запрос — одна задача, один контекст, один фокус. Модель отлично следует чётким инструкциям, когда у неё один конкретный фокус. «Напиши только этот абзац, вот так, вот для этого» — работает намного лучше, чем «напиши всё и хорошо». Три роли используют эту особенность напрямую.

Когда применять

Сложные задачи с 5 и более этапами — написание структурных документов, глубокий анализ, разработка стратегии с итерациями, создание учебных программ. Особенно полезно когда задача нелинейная и понимание меняется в процессе работы. НЕ подходит: задачи на 1-2 шага — три роли только перегрузят ответ и не дадут прироста.

Мини-рецепт

1. Вложи 90% усилий в описание задачи для планировщика. Не жалей деталей: контекст, ограничения, аудитория, желаемый формат. Чем точнее описание — тем точнее декомпозиция.
2. Добавь инструкцию для исполнителя — буквально одна строка: «выполни только подзадачу от планировщика, не выходи за её рамки».
3. Добавь инструкцию для памяти: «зафиксируй — что выполнено, что осталось, что изменилось в понимании задачи».
4. Расставь явные маркеры переключения между ролями: «ПОДЗАДАЧА: [формулировка]», «ШАГ ВЫПОЛНЕН», «ОБНОВЛЁННЫЙ КОНТЕКСТ». Без маркеров модель размывает границы между ролями.
5. Повторяй цикл: планировщик — исполнитель — память — снова планировщик. До завершения задачи.

Примеры

[ПЛОХО] : Напиши подробный анализ рынка с выводами и рекомендациями
[ХОРОШО] : Работай в трёх ролях. Каждую — отдельным блоком с заголовком. ПЛАНИРОВЩИК: разбей задачу на конкретные смысловые блоки. Объясни логику порядка. Заверши: "ПОДЗАДАЧА: [что делать первым]" ИСПОЛНИТЕЛЬ: выполни только эту подзадачу. Не планируй вперёд. Заверши: "ШАГ ВЫПОЛНЕН" ПАМЯТЬ: зафикcируй — что готово, что осталось, что изменилось в понимании задачи. Заверши: "ОБНОВЛЁННЫЙ КОНТЕКСТ: [краткое резюме для планировщика]" Задача: анализ рынка электромобилей в России. Аудитория — производители комплектующих. Нужны цифры по сегментам и конкретные рекомендации по входу на рынок.
Источник: Planner Matters! An Efficient and Unbalanced Multi-agent Collaboration Framework for Long-horizon Planning
ArXiv ID: 2605.02168 | Сгенерировано: 2026-05-05 05:33

Проблемы LLM

ПроблемаСутьКак обойти
Один запрос не может одновременно стратегировать и выполнятьПросишь написать сложный документ или решить многошаговую задачу одним запросом. Модель пытается держать в голове и общую цель, и детали каждого шага. Это конфликт. Результат: либо теряет нить (шаги правильные, но не туда), либо теряет точность шагов (нить есть, но детали плывут). Архитектурная причина: у модели нет отдельного «стратегического центра». Она генерирует слева направо. Стратегия и исполнение усредняютсяРаздели запрос на роли явно. Отдельный блок для планирования. Отдельный — для выполнения одного шага. Отдельный — для фиксации прогресса. Каждая роль получает одну узкую задачу

Методы

МетодСуть
Три явные роли в одном запросе — планировщик, исполнитель, памятьСтруктурируй сложный запрос тремя именованными блоками. Планировщик — получает задачу и текущий контекст, разбивает на подзадачи, формулирует одну конкретную подзадачу для следующего шага. Исполнитель — берёт только эту подзадачу, делает один шаг, не смотрит вперёд. Память — фиксирует что сделано, что осталось, что изменилось в понимании. Возвращает обновлённый контекст планировщику. Цикл повторяется. Добавь маркеры переключения: "ПОДЗАДАЧА: [формулировка]", "ШАГ ВЫПОЛНЕН", "ОБНОВЛЁННЫЙ КОНТЕКСТ: [резюме]" — модель чётче переключается между режимами. Когда применять: задача с пятью и более этапами, нелинейная логика, длинный результат. Не нужен: простые задачи за один-два шага — три роли только перегрузят ответ
📖 Простыми словами

Planner Matters! An Efficient and Unbalanced Multi-agentCollaboration Framework for Long-horizon Planning

arXiv: 2605.02168

Когда LLM берется за сложную задачу из ста шагов, она ведет себя как человек с плохой памятью: увлекается деталями и напрочь забывает, куда вообще шла. Исследование доказывает фундаментальную вещь: в многоагентных системах планирование важнее исполнения. Если ты дашь слабой модели идеальный план, она справится. Если дашь суперкомпьютеру кривой план, он выдаст дорогую и качественную, но абсолютно бесполезную херню. Успех всей цепочки на 90% зависит от того, насколько четко нарезан маршрут, а не от того, насколько «умный» агент нажимает на кнопки.

Это как стройка дома, где у тебя есть гениальный архитектор и бригада рабочих. Если архитектор нарисовал лестницу, ведущую в тупик, то даже если ее построят лучшие мастера мира из итальянского мрамора, ходить по ней всё равно нельзя. В LLM-системах мы часто пытаемся нанять «дорогих рабочих» (мощные модели) на каждый чих, хотя на самом деле нужно было просто вложиться в одного толкового прораба, который продумает логику процесса.

Авторы предлагают метод несбалансированного сотрудничества: вместо того чтобы раздувать всю систему, нужно максимально прокачивать только «мозг» — Planner. Эксперименты показали, что масштабирование одного лишь планировщика дает такой же буст к результату, как если бы ты увеличил мощность всех агентов сразу. Это экономит кучу денег и времени: ты берешь топовую модель (например, GPT-4o) на роль стратега, а грязную работу по поиску или форматированию отдаешь дешевым «малышам». Главное, чтобы стратегический центр не размывался между задачами.

Принцип универсален: будь то написание сложной статьи для VC.ru, веб-серфинг или кодинг огромного проекта. Модели лажают, потому что пытаются одновременно «думать» и «делать», а их архитектура к этому не приспособлена — они просто генерируют следующий токен. Разделение труда, где Planner отвечает за структуру, а исполнители — за мясо, превращает хаотичный поток сознания в четкий рабочий процесс. Разделяй и властвуй теперь работает и для нейронок.

Короче, хватит надеяться, что умная модель «сама разберется» по ходу дела. Она не разберется, а просто уверенно уйдет в дебри. Хочешь результат — инвестируй в качество планирования и выделяй под это отдельную, самую мощную роль. Планировщик решает всё, а исполнители — это просто расходный материал. Либо у тебя есть нормальная карта, либо ты очень качественно идешь в пропасть.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с