3,583 papers
arXiv:2605.08761 74 9 мая 2026 г. FREE

Пять точек провала мульти-ролевых AI-цепочек: что ломается когда задачу выполняют несколько ролей

КЛЮЧЕВАЯ СУТЬ
Когда в ChatGPT/Claude пытаются решить сложную задачу через несколько ролей или шагов, цепочка разваливается в предсказуемых местах. Исследователи запустили 300 корпоративных сценариев через 11 специализированных AI-агентов и точно зафиксировали где и почему ломается координация между ролями.
Адаптировать под запрос

TL;DR

Когда в ChatGPT/Claude пытаются решить сложную задачу через несколько ролей или шагов, цепочка разваливается в предсказуемых местах. Исследователи запустили 300 корпоративных сценариев через 11 специализированных AI-агентов и точно зафиксировали где и почему ломается координация между ролями.

Главная находка: Провал происходит не там, где интуитивно ожидаешь. Каждый агент в отдельности справляется неплохо — но при передаче задачи между ролями что-то теряется. Конкретно: контекст у передающей роли есть, а получающая роль его не получает. Или получает, но не те параметры. Или всё выполнено, но финальный шаг — «закрыть задачу» — так и не сделан. Или финальный ответ звучит как «возможно, скорее всего, если условия совпадут» вместо конкретного решения.

Исследование описывает пять точек провала, каждая из которых напрямую заменяется промпт-инструкцией. Принцип «одна задача — одна специализированная роль» работает лучше, чем «один агент делает всё» — но только если правильно организовать передачу между шагами.


🔬

Схема метода

Каждый шаг мульти-ролевой цепочки требует 5 явных инструкций:

ШАГ 1: Роль → чёткая, специализированная, не «помощник»
ШАГ 2: Контекст → явная передача всех нужных данных при смене роли
ШАГ 3: Параметры → конкретные значения, не абстрактные описания
ШАГ 4: Закрытие → явная инструкция завершить задачу, не просто выполнить шаги
ШАГ 5: Решение → инструкция дать чёткий ответ, не «это зависит от...»

Выполняется в одном промпте (мульти-ролевой формат)
или в серии запросов (передача между чатами).

🚀

Пример применения

Задача: Макс Корж (владелец небольшого интернет-магазина одежды на Wildberries) получил жалобу от крупного оптового клиента: задержка поставки, испорченные отношения, клиент хочет скидку 20% на следующий заказ на 200 000 ₽. Нужно принять решение: одобрить или нет.

Промпт:

Ты работаешь последовательно в трёх ролях. Каждая роль получает 
полный контекст от предыдущей.

---
РОЛЬ 1 — Специалист по работе с клиентами:
Твоя задача: оценить ситуацию и сформулировать рекомендацию 
для финансового отдела.

Ситуация: [вставь описание жалобы и историю клиента]

Сделай это:
- Оцени весомость претензии (реальный ущерб или манипуляция)
- Укажи ценность клиента для бизнеса (частота, объём, история)
- Сформулируй КОНКРЕТНУЮ рекомендацию: какой % скидки обоснован

Передай результат следующей роли в структурированном виде:
Весомость претензии: [высокая/средняя/низкая] — [почему]
Ценность клиента: [высокая/средняя/низкая] — [почему]
Рекомендация: [X%] или [отказать] — [обоснование]

---
РОЛЬ 2 — Финансовый аналитик:
Получаешь данные от Роли 1 выше.
Твоя задача: проверить финансовую выполнимость.

Данные: заказ на 200 000 ₽, запрошенная скидка 20% = 40 000 ₽
Средняя маржа на категорию одежды: 35%

Сделай это:
- Рассчитай чистую прибыль с заказом со скидкой
- Рассчитай чистую прибыль без этого клиента
- Укажи пороговый % скидки, после которого невыгодно

Передай результат Роли 3:
Прибыль со скидкой X%: [сумма]
Порог выгодности: [X%]
Финансовая рекомендация: [одобрить до X% / не одобрять]

---
РОЛЬ 3 — Руководитель, принимающий решение:
Получаешь данные от Ролей 1 и 2 выше.

Прими КОНКРЕТНОЕ решение:
— Какую скидку одобрить (точный %, не диапазон)
— Условия предоставления (одноразово? на следующий заказ?)
— Готовый текст ответа клиенту (2-3 предложения)

Не пиши «возможно» или «зависит от». 
Дай финальное решение как если бы ты уже его принял.

Результат: Модель последовательно пройдёт три роли в одном ответе. Каждая роль передаёт структурированный блок данных следующей — без потери контекста. Роль 3 выдаст конкретный процент скидки, условие и готовый текст письма клиенту, без размытых формулировок.


🧠

Почему это работает

Проблема с мульти-ролевыми задачами — в точках передачи. Когда одна роль заканчивает работу и начинается другая, модель не «помнит» что важно для следующего шага. Без явной инструкции передать конкретные данные — она передаёт нарратив, а не структурированные параметры. Следующая роль начинает с неполной картиной.

Второй провал — размытые решения. Модели по умолчанию склонны к осторожным формулировкам: «это зависит от контекста», «возможно стоит рассмотреть». Это защитное поведение — модель генерирует текст, который выглядит разумно в самых разных ситуациях. Явная инструкция «прими решение как если бы ты уже его принял» меняет паттерн генерации.

Третий провал — незакрытые задачи. Модель выполняет действия, но не завершает задачу. Как менеджер, который провёл встречу, но не отправил итоги. Явная инструкция «закрой задачу» добавляет этот шаг.

Рычаги управления: - Формат передачи — чем структурированнее блок передачи между ролями (как здесь: «передай результат в виде:»), тем точнее следующая роль понимает задачу - Конкретность параметров — вместо «учти финансовый аспект» дай числа: заказ 200К, маржа 35% - Инструкция решения — «дай ответ как если бы ты уже решил» включает другой паттерн, чем «что думаешь?» - Число ролей — три роли оптимально для большинства задач; больше пяти — контекст начинает теряться даже с явной передачей


📋

Шаблон промпта

Ты работаешь последовательно в {число} ролях. 
Каждая роль получает полный контекст от предыдущей.

---
РОЛЬ 1 — {название роли 1}:
Твоя задача: {что делает эта роль}

Контекст: {все данные, нужные этой роли}

Сделай это:
- {конкретное действие 1}
- {конкретное действие 2}

Передай следующей роли в структурированном виде:
{параметр 1}: [значение] — [почему]
{параметр 2}: [значение] — [почему]
Рекомендация: {конкретный вывод}

---
РОЛЬ 2 — {название роли 2}:
Получаешь данные от Роли 1 выше.
Твоя задача: {что делает эта роль}

Данные: {конкретные числа и факты для этой роли}

Сделай это:
- {конкретное действие 1}
- {конкретное действие 2}

Передай следующей роли:
{параметр 1}: [значение]
{параметр 2}: [значение]
Рекомендация: {конкретный вывод}

---
РОЛЬ {N} — {финальная роль}:
Получаешь данные от всех предыдущих ролей.

Прими КОНКРЕТНОЕ решение:
- {что именно решить}
- {в каком формате ответ}

Не пиши «возможно» или «зависит от».
Дай финальный ответ как если бы ты уже его принял.

Что подставлять: - {число} — количество ролей (2–5, оптимально 3) - {название роли} — специализация, не "ассистент": «юрист», «финансист», «редактор», «скептик» - {конкретные числа и факты} — чем точнее параметры, тем точнее работа второй и третьей роли - {что именно решить} — конкретный вопрос: «одобрить или нет», «выбрать вариант A, B или C»


🚀 Быстрый старт — вставь в чат:

Вот шаблон мульти-ролевого промпта. Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить все поля.

[вставить шаблон выше]

LLM спросит: сколько ролей нужно, какие специализации подходят, какие параметры важны для передачи между ролями — потому что без этого шаблон нельзя правильно заполнить. Она возьмёт структуру и адаптирует под твою задачу.


⚠️

Ограничения

⚠️ Длинные цепочки теряют контекст: Больше 4–5 ролей — и даже с явной передачей параметры начинают искажаться. Разбивай на отдельные сессии.

⚠️ Работает для структурируемых задач: Там, где есть правильный ответ или чёткий критерий решения — отлично. Для субъективных творческих задач («какой стиль лучше?») роль финансиста или юриста не добавляет ценности.

⚠️ Параметры нужно знать заранее: Шаблон работает когда ты понимаешь что передавать между ролями. Если не знаешь какие данные важны для следующего шага — спроси LLM это сформулировать до запуска цепочки.

⚠️ Модели всё равно иногда закрывают задачу не полностью: Даже с явной инструкцией «закрой задачу» — иногда нужен отдельный запрос «теперь напиши итоговое сообщение». Это остаточная проблема, которую исследование фиксирует как нерешённую даже у сильных моделей.


🔗

Ресурсы

Название: Beyond the All-in-One Agent: Benchmarking Role-Specialized Multi-Agent Collaboration in Enterprise Workflows

Код и данные: github.com/yutao1024/EntCollabBench · huggingface.co/datasets/Kirito-Lab/EntCollabBench

Авторы: Tao Yu, Hao Wang, Changyu Li и др. — BAAI (Beijing Academy of Artificial Intelligence), CASIA (Chinese Academy of Sciences), Peking University, Tsinghua University, UCAS

Дата: май 2026


Проблемы LLM

ПроблемаСутьКак обойти
Контекст теряется при смене ролиРазбиваешь задачу на шаги: аналитик финансист руководитель. Каждая роль работает нормально. Но при переходе теряется главное: следующая роль получает нарратив, а не конкретные параметры. Финансист не знает точный процент маржи. Руководитель не знает ценность клиента. Решение принимается без нужных данныхЯвно передавай структурированный блок между ролями. Не "резюме ситуации", а поля с конкретными значениями: Ценность клиента: высокая — платит 3 года, ни одного возврата. Следующая роль получает факты, а не пересказ
Цепочка выполнена, но задача не закрытаВсе роли отработали. Анализ сделан, расчёт готов. Но финального результата нет. Модель не написала письмо клиенту. Не выдала итоговый процент. Остановилась на шаге "всё рассмотрено". Это как менеджер, который провёл совещание, но не отправил решениеВ инструкцию финальной роли добавь явный финальный шаг: Напиши готовый текст для клиента или Укажи точный процент, не диапазон. Без этого модель считает задачу выполненной после анализа

Методы

МетодСуть
Структурированный блок передачи между ролямиВ конец каждой роли добавь явный шаблон передачи: Передай следующей роли: Параметр 1: [значение][почему]. Рекомендация: [конкретный вывод]. Каждое поле заполняет текущая роль. Следующая читает поля, а не нарратив. Почему работает: модель "видит" что именно нужно передать. Без шаблона решает сама — и передаёт то, что кажется ей важным, а не то, что нужно следующему шагу. Когда применять: любая задача с двумя и более специализированными шагами. Когда не работает: творческие задачи без чёткого критерия — там "параметры для передачи" не существуют

Тезисы

ТезисКомментарий
Модель не решает — она хеджирует. Это нужно отключать явноПо умолчанию модель пишет осторожно: "возможно", "зависит от контекста", "стоит рассмотреть". Это защитное поведение — текст выглядит разумно в любой ситуации. Финальная роль в цепочке особенно склонна к этому: она получила много аргументов с разных сторон и честно транслирует неопределённость. Применяй: добавь прямую инструкцию Не пиши «возможно» или «зависит от». Дай ответ как если бы ты уже принял решение. Это меняет паттерн генерации — модель выдаёт конкретный вывод, а не взвешенную картину
📖 Простыми словами

Beyond the All-in-OneAgent: Benchmarking Role-Specialized Multi-AgentCollaboration in Enterprise Workflows

arXiv: 2605.08761

Проблема всех современных AI-агентов в том, что они пытаются быть мастерами на все руки, но в итоге лажают как стажеры в первый рабочий день. Когда ты просишь одну модель примерить на себя пять разных ролей для решения сложной задачи, она неизбежно теряет фокус. Фундаментальная механика мульти-агентных систем ломается не на самих рассуждениях, а в точках передачи данных. Модель просто не понимает, что именно из её огромного монолога критически важно для следующего «коллеги», и вместо четких фактов передает размытый пересказ.

Это как если бы на стройке прораб, архитектор и каменщик были одним и тем же человеком, который каждые пять минут переодевается в новую каску. Пока он меняет костюм, он забывает, что архитектор уже утвердил толщину стен, и начинает импровизировать на ходу. В итоге получается кривой сарай вместо дома. Формально все роли отыграны, но из-за постоянного переключения контекста и потери деталей на стыках этапов вся конструкция разваливается.

Исследователи прогнали 300 сценариев через 11 специализированных агентов и выяснили, что спасает только жесткая ролевая специализация. Чтобы система не тупила, нужны три вещи: структурированные параметры вместо текстовой воды, явные инструкции по передаче (что именно передаем дальше) и контроль границ ответственности. Если агент-аналитик передает агенту-директору просто «мнение» вместо конкретных цифр по скидке в 20%, директор примет решение на основе галлюцинаций, а не экономики.

Принцип универсален: будь то разбор жалоб на Wildberries, юридический аудит или написание кода. Везде, где есть цепочка «анализ — решение — действие», обычный чат-бот рано или поздно вылетит в кювет. Тестирование показало, что координация ролей важнее, чем умственные способности отдельной модели. Если ты не настроил протокол общения между своими виртуальными сотрудниками, они просто будут перекладывать бумажки, пока не кончится контекстное окно.

Короче: забудь про концепцию «один агент для всего», это путь в никуда для серьезного бизнеса. Будущее за бенчмаркингом ролевых взаимодействий и жестким разделением труда. Либо ты строишь конвейер с четкими входами и выходами, либо твой AI-ассистент так и останется дорогой игрушкой, которая вроде что-то делает, но постоянно косячит в элементарных вещах. Специализация бьет универсальность, когда на кону стоят реальные деньги и рабочие процессы.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с