3,583 papers
arXiv:2605.17292 74 17 мая 2026 г. FREE

MetaCogAgent: самооценка компетентности перед ответом через симуляцию специализированных ролей

КЛЮЧЕВАЯ СУТЬ
У модели нет встроенного тормоза «это вне моей зоны» — она генерирует текст с одинаковой уверенностью, знает ответ или нет. Попросишь написать код с вероятностной статистикой — получишь синтаксически верный, математически сломанный. Метод MetaCogAgent позволяет добавить шаг самооценки ДО ответа: три специализированные роли в одном промпте оценивают уверенность 0-100, объясняют почему, честно называют слабые стороны — и только потом тот, кто набрал больше, даёт ответ. Фишка: добавление запроса «оцени уверенность перед ответом» заставляет модель реально различать простые и сложные задачи — вместо дефолтного «отвечу за всё» получаешь явные границы компетентности и делегирование.
Адаптировать под запрос

TL;DR

MetaCogAgent — техника, при которой каждый агент перед выполнением задачи оценивает свою уверенность, сравнивает её с историческим профилем, и передаёт задачу тому, кто справится лучше. Ключевой механизм: задача не решается сразу — сначала идёт оценка «могу ли я это сделать хорошо», и только потом — исполнение или делегирование.

Главная проблема, которую решает метод: модели не знают, чего не знают. Попросишь Claude написать Python-функцию с вероятностной статистикой — он напишет синтаксически правильный код, который математически неверен. Без предварительной самооценки модель берётся за всё с одинаковой уверенностью. Результат: плавно написанные ошибки.

Метод вводит три слоя. Первый — вербализованная уверенность: агент явно оценивает себя до ответа в цифрах. Второй — сравнение этой оценки с историческим профилем: если «думаю, справлюсь» расходится с «обычно облаживаюсь на таких задачах» — система перестраховывается. Третий — после выполнения задачи агент обновляет своё представление о границах компетентности. В чате это симулируется через несколько специализированных ролей в одном промпте: каждая роль оценивает задачу, лучшая — выполняет.


🔬

Схема метода

(один промпт, все три роли внутри)

ШАГ 1: Распределение ролей
  → 3 специалиста с разными профилями

ШАГ 2: Параллельная самооценка [все роли]
  каждая роль: уверенность 0-100 + обоснование
  → таблица уверенностей

ШАГ 3: Конфликт-детекция
  если вербальная оценка ≠ историческая → тройная проверка
  → скорректированные пороги

ШАГ 4: Делегирование
  если max_уверенность < 50:  Совместный режим (все + взвешенное голосование)
  иначе: лучший агент → финальный ответ

🚀

Пример применения

Задача: Основатель EdTech-стартапа хочет понять, стоит ли пивотнуть с B2C-приложения для школьников на B2B-платформу для корпоративного обучения. Задача одновременно про продукт, рынок и финансы — классический кросс-домен.

Промпт:

В этом диалоге работают три специалиста:

- Специалист-А: стратег и аналитик рынка (сильный в бизнес-логике, слабый в технике)
- Специалист-Б: продуктовый менеджер (сильный в UX и продукте, умеренный в финансах)
- Специалист-В: финансовый аналитик (сильный в юнит-экономике, слабый в продукте)

**Задача:** Стартап Skillpath.ru работает год на B2C: приложение для подготовки к ЕГЭ, 
8 000 платящих пользователей, ARPU 900 руб/мес. Поступило предложение от HR-директора 
Wildberries: корпоративная лицензия на 500 сотрудников за 3 млн рублей в год. 
Стоит ли пивотировать в B2B?

**ШАГИ:**

1. Каждый специалист оценивает задачу ДО ответа:
   - Уверенность: [0-100]
   - Почему именно так: [1-2 предложения]
   - Что НЕ в моей зоне экспертизы: [честно]

2. Проверка расхождений:
   Если чья-то вербальная уверенность > 70, но задача явно выходит за профиль — снизить до реалистичной.

3. Делегирование:
   - Если кто-то набрал > 75 — он отвечает
   - Если никто не добрал до 75 — все трое дают частичный ответ, 
     финальный вывод взвешивается по уверенности

4. Финальный ответ от исполнителя (или совместный режим).
   В конце: какие аспекты остались вне покрытия и что стоит уточнить отдельно.

Результат: Модель покажет таблицу самооценок трёх специалистов с баллами и обоснованием. Один из них — вероятно, стратег или финансист — наберёт наибольшую уверенность и даст развёрнутый ответ. Если задача слишком кросс-доменная, увидишь совместный режим: три частичных ответа с пометками «вне моей зоны» и финальный синтез. Важно: модель явно укажет, где её анализ слаб — это редкость без такой инструкции.


🧠

Почему это работает

Модель по умолчанию генерирует текст, который выглядит уверенно, — вне зависимости от реальной точности. У неё нет встроенного механизма «притормози, это не моё». Это не баг характера — это архитектурная особенность: генерировать следующий токен, который звучит правдоподобно.

Модель хорошо умеет другое: следовать явным ролевым инструкциям и вербализовать степень уверенности, когда её явно просят. Если попросить «оцени уверенность 0-100», модель действительно начинает различать задачи по сложности. Это не магия — это то, что было в её обучающих данных: люди так рассуждают.

Метод использует это сочетание: роли убирают размытый дженерализм («отвечу за всё»), а явный запрос уверенности запускает что-то вроде внутренней проверки перед ответом. Структура с порогом делегирования превращает это из монолога в систему с самокоррекцией.

Рычаги управления:

Параметр Как менять Зачем
Порог делегирования (75) Снизь до 60 для сложных задач Больше делегирований, меньше самонадеянности
Имена и профили специалистов Назови конкретно: «Алексей — ex-BCG консультант» Острее ролевое исполнение
Совместный режим Убери условие — все трое всегда отвечают Видно разные углы зрения
Пункт «вне экспертизы» Удали Если хочешь ответ без оговорок

📋

Шаблон промпта

В этом диалоге работают три специалиста:

- Специалист-А: {профиль_А} (силён в {область_А}, слабее в {слабость_А})
- Специалист-Б: {профиль_Б} (силён в {область_Б}, слабее в {слабость_Б})
- Специалист-В: {профиль_В} (силён в {область_В}, слабее в {слабость_В})

**Задача:** {задача}

**ШАГИ:**

1. Каждый специалист оценивает задачу ДО ответа:
   - Уверенность: [0-100]
   - Почему именно так: [1-2 предложения]
   - Что НЕ в моей зоне экспертизы: [честно]

2. Проверка расхождений:
   Если вербальная уверенность > 70, но задача явно за пределами профиля — скорректировать вниз.

3. Делегирование:
   - Если кто-то набрал > {порог} — он отвечает
   - Если никто не добрал — все дают частичный ответ,
     итог взвешивается по уверенности

4. Финальный ответ от исполнителя (или совместный режим).
   В конце: какие аспекты вне зоны покрытия и что стоит уточнить отдельно.

Что подставлять: - {профиль_А/Б/В} — роль: маркетолог, юрист, технарь, финансист, продакт - {область_X} — сильная сторона: «юнит-экономика» или «SEO и контент» - {слабость_X} — честная слабость: «технические аспекты», «правовая база» - {задача} — конкретный вопрос с деталями и цифрами - {порог} — обычно 70-75; снизь до 60 если задача заведомо сложная


🚀 Быстрый старт — вставь в чат:

Вот шаблон MetaCogAgent с самооценкой специалистов. Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы определить нужные роли и их профили.

[вставить шаблон выше]

LLM спросит, какие специалисты нужны и в чём их ключевая экспертиза — потому что роли определяют, кто и что оценивает в шаге делегирования. Она возьмёт структуру из шаблона и подставит правильные профили под твою задачу.


⚠️

Ограничения

⚠️ Простые задачи: Для «напиши письмо» или «объясни слово» метод избыточен — тратишь токены на самооценку там, где она ничего не даёт. Сам исследователи рекомендуют байпасить механизм на рутинных задачах.

⚠️ Нет памяти между сессиями: В оригинале агенты накапливают профиль компетентности со временем. В чате каждый раз начинаешь с нуля — профиль не сохраняется. Эффект меньше, чем в системе с историей.

⚠️ Точность самооценки снижается на сложных задачах: ECE (мера расхождения уверенности и реальности) у оригинальной системы ухудшается на Hard-задачах. В чате — аналогично: чем экзотичнее область, тем менее надёжна самооценка специалиста.

⚠️ Три агента — оптимум: Авторы исследовали только три агента. С двумя нет настоящего «делегирования», с пятью — промпт перегружается. Оптимум — 3 роли.


🔗

Ресурсы

MetaCogAgent: A Metacognitive Multi-Agent LLM Framework with Self-Aware Task Delegation

Авторы: Chenyu Wang (Zhengzhou University), Yang Shu (Zhejiang University, corresponding author: shuyang@zju.edu.cn)

Связанные работы упомянутые в статье: AutoGen (Wu et al.), MetaGPT, Reflexion (Shinn et al.), Tree of Thoughts (Yao et al.), теория метакогниции Flavell [7]


📋 Дайджест исследования

Ключевая суть

У модели нет встроенного тормоза «это вне моей зоны» — она генерирует текст с одинаковой уверенностью, знает ответ или нет. Попросишь написать код с вероятностной статистикой — получишь синтаксически верный, математически сломанный. Метод MetaCogAgent позволяет добавить шаг самооценки ДО ответа: три специализированные роли в одном промпте оценивают уверенность 0-100, объясняют почему, честно называют слабые стороны — и только потом тот, кто набрал больше, даёт ответ. Фишка: добавление запроса «оцени уверенность перед ответом» заставляет модель реально различать простые и сложные задачи — вместо дефолтного «отвечу за всё» получаешь явные границы компетентности и делегирование.

Принцип работы

Стандартный подход: дал задачу → получил ответ с невидимой неуверенностью внутри. MetaCogAgent: дал задачу → каждая роль оценила «могу ли я это» → лучший ответил. Три роли — не для красоты. Роли убирают «дженерализм»: модель перестаёт быть одним субъектом, который «знает всё», и становится тремя специалистами с задекларированными слабостями. Порог делегирования (обычно 75 из 100) превращает это в систему с самокоррекцией. Если никто не дотянул — включается совместный режим: все трое дают частичный ответ, финал взвешивается по уверенности.

Почему работает

Модель по умолчанию генерирует следующий токен, который «звучит правдоподобно». Нет архитектурного тормоза — есть только следующий правдоподобный токен. Но в обучающих данных есть другое: люди рассуждают о сложности задачи перед решением. Когда явно просишь «оцени 0-100 ДО ответа» — модель активирует именно этот паттерн. Модель знает, чего не знает — она просто молчит об этом, если не спросить напрямую. Роли плюс порог делегирования превращают скрытую неуверенность в явную и управляемую.

Когда применять

Кросс-доменные задачи — когда вопрос одновременно про право и финансы, про продукт и маркетинг, про стратегию и технику. Особенно полезно, когда нужно понять, какая часть ответа надёжна, а какая — выдумка с уверенным лицом. НЕ подходит для простых однодоменных задач: «напиши письмо», «переведи текст», «объясни слово» — самооценка трёх ролей съедает токены без какой-либо пользы.

Мини-рецепт

1. Задай три роли с профилями: каждой — сильную область и честную слабость. Не «эксперт в бизнесе», а «силён в юнит-экономике, слабее в правовых вопросах».
2. Добавь шаг самооценки перед ответом: каждая роль пишет уверенность 0-100, почему именно так, и что явно вне её зоны.
3. Поставь порог делегирования: обычно 75. Для заведомо сложных задач — снизь до 60.
4. Пропиши совместный режим: если никто не дотянул до порога — все трое дают частичный ответ, итог взвешивается по уверенности.
5. Попроси назвать пробелы в конце: что осталось вне покрытия и что стоит уточнить у другого специалиста. Это самая ценная часть — модель честно укажет, где её анализ слаб.

Примеры

[ПЛОХО] : Стоит ли нам пивотировать с продаж физлицам на корпоративный сегмент и как это считать?
[ХОРОШО] : В этом диалоге работают три специалиста: - Специалист-А: стратег (силён в бизнес-логике и рынке, слабее в технике) - Специалист-Б: продуктовый менеджер (силён в продукте и пользователях, умеренно в финансах) - Специалист-В: финансовый аналитик (силён в юнит-экономике, слабее в продукте) Задача: стартап, 8 000 платящих пользователей, средний чек 900 руб/мес. Поступило предложение: корпоративная лицензия на 500 сотрудников за 3 млн рублей в год. Стоит ли пивотировать в корпоративный сегмент? ШАГИ: 1. Каждый специалист — уверенность 0-100, почему именно так, что НЕ в его зоне 2. Если уверенность > 75 — он отвечает. Если никто не дотянул — совместный режим 3. В конце: что осталось вне покрытия и что стоит уточнить отдельно
Источник: MetaCogAgent: A Metacognitive Multi-Agent LLM Framework with Self-Aware Task Delegation
ArXiv ID: 2605.17292 | Сгенерировано: 2026-05-19 05:39

Проблемы LLM

ПроблемаСутьКак обойти
Модель не тормозит перед сложной задачейМодель генерирует уверенный текст независимо от реальной точности. Попроси написать код со статистикой — напишет синтаксически правильно и математически неверно. Без явного стопа берётся за всё с одинаковой уверенностью. Результат: гладко написанные ошибкиПопроси оценить уверенность числом (0–100) до ответа, а не после. Добавь явное поле "что не в моей зоне": это запускает проверку перед генерацией, а не извинения после

Методы

МетодСуть
Роли с порогом делегирования — меньше уверенного дженерализмаЗадай 3 специалиста с чёткими сильными и слабыми сторонами. Каждый оценивает уверенность до ответа (0–100) и честно называет что вне его зоны. Тот кто набрал больше порога (70–75) — отвечает. Никто не добрал — все дают частичный ответ, итог взвешивается по уверенности. Специалист-А: финансист (силён в юнит-экономике, слабее в продукте) Уверенность: 82. Вне зоны: UX-решения. Почему работает: роль с явной слабостью убирает размытый режим "отвечу за всё". Явный запрос числа включает различение задач по сложности — модель умеет это делать но без запроса не делает. Когда применять: кросс-доменные задачи (юридическое + финансовое, продуктовое + стратегическое). Когда избыточно: простые однозадачные запросы — тратишь токены впустую
📖 Простыми словами

MetaCogAgent: A Metacognitive Multi-AgentLLMFramework with Self-Aware Task Delegation

arXiv: 2605.17292

Суть MetaCogAgent в том, что нейросети наконец-то пытаются привить зачатки самокритики. Обычная LLM работает как самоуверенный стажер: на любой вопрос она выдает ответ с каменным лицом, даже если несет полную чушь. Она просто не умеет вовремя заткнуться, потому что ее архитектура заточена на генерацию текста, а не на проверку фактов. Этот фреймворк меняет правила игры: теперь агент сначала делает паузу и спрашивает себя: «А я вообще в этом шарю?». Только после оценки собственной уверенности и сверки с «личным делом» (историческим профилем) он либо берется за работу, либо делегирует ее тому, кто умнее в этой узкой нише.

Это как если бы ты пришел к терапевту с болью в колене, и он не стал бы гадать на кофейной гуще, а честно сказал: «Слушай, я по простудам, а тебе нужен хирург». В обычном мире нейросетей терапевт бы просто начал оперировать тебя кухонным ножом, потому что «выглядеть уверенно» для модели важнее, чем быть правой. MetaCogAgent превращает толпу бестолковых ботов в слаженную команду профи, где каждый знает границы своей компетенции и не лезет в чужую область, чтобы не накосячить.

Внутри системы работают три роли: планировщик, исполнитель и контролер. Когда прилетает сложная задача — например, стоит ли стартапу менять бизнес-модель — система не вываливает общие советы. Она дробит запрос на части. Если агент по маркетингу видит, что вопрос касается финансов, он не пытается изображать эксперта, а смотрит на свой рейтинг успеха в этой теме. Если рейтинг низкий, задача улетает финансовому агенту. Весь процесс завязан на метапознании — способности модели осознавать свои ограничения еще до того, как она успела нагаллюцинировать лишнего.

Этот подход — спасение для кросс-доменных задач, где нужно одновременно понимать в коде, праве и маркетинге. Тестировали на сложных кейсах, но принцип универсален: от разработки софта до управления проектами. Вместо того чтобы раздувать одну модель до бесконечности, мы строим сеть узких специалистов, которые умеют передавать пас. SEO для роботов уходит в прошлое, теперь важнее выстроить иерархию агентов, которые умеют вовремя сказать «я не знаю» и позвать коллегу.

Главный вывод: будущее не за одной «умной» нейросетью, а за системой, которая умеет фильтровать собственный бред. Если агент не оценивает свою уверенность перед ответом, он бесполезен для серьезного бизнеса. MetaCogAgent доказывает, что делегирование — это не признак слабости, а единственный способ получить адекватный результат в сложных проектах. Либо ты учишь свои модели сомневаться, либо продолжаешь получать красиво упакованную дезинформацию.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с