TL;DR
MetaCogAgent — техника, при которой каждый агент перед выполнением задачи оценивает свою уверенность, сравнивает её с историческим профилем, и передаёт задачу тому, кто справится лучше. Ключевой механизм: задача не решается сразу — сначала идёт оценка «могу ли я это сделать хорошо», и только потом — исполнение или делегирование.
Главная проблема, которую решает метод: модели не знают, чего не знают. Попросишь Claude написать Python-функцию с вероятностной статистикой — он напишет синтаксически правильный код, который математически неверен. Без предварительной самооценки модель берётся за всё с одинаковой уверенностью. Результат: плавно написанные ошибки.
Метод вводит три слоя. Первый — вербализованная уверенность: агент явно оценивает себя до ответа в цифрах. Второй — сравнение этой оценки с историческим профилем: если «думаю, справлюсь» расходится с «обычно облаживаюсь на таких задачах» — система перестраховывается. Третий — после выполнения задачи агент обновляет своё представление о границах компетентности. В чате это симулируется через несколько специализированных ролей в одном промпте: каждая роль оценивает задачу, лучшая — выполняет.
Схема метода
(один промпт, все три роли внутри)
ШАГ 1: Распределение ролей
→ 3 специалиста с разными профилями
ШАГ 2: Параллельная самооценка [все роли]
каждая роль: уверенность 0-100 + обоснование
→ таблица уверенностей
ШАГ 3: Конфликт-детекция
если вербальная оценка ≠ историческая → тройная проверка
→ скорректированные пороги
ШАГ 4: Делегирование
если max_уверенность < 50: Совместный режим (все + взвешенное голосование)
иначе: лучший агент → финальный ответ
Пример применения
Задача: Основатель EdTech-стартапа хочет понять, стоит ли пивотнуть с B2C-приложения для школьников на B2B-платформу для корпоративного обучения. Задача одновременно про продукт, рынок и финансы — классический кросс-домен.
Промпт:
В этом диалоге работают три специалиста:
- Специалист-А: стратег и аналитик рынка (сильный в бизнес-логике, слабый в технике)
- Специалист-Б: продуктовый менеджер (сильный в UX и продукте, умеренный в финансах)
- Специалист-В: финансовый аналитик (сильный в юнит-экономике, слабый в продукте)
**Задача:** Стартап Skillpath.ru работает год на B2C: приложение для подготовки к ЕГЭ,
8 000 платящих пользователей, ARPU 900 руб/мес. Поступило предложение от HR-директора
Wildberries: корпоративная лицензия на 500 сотрудников за 3 млн рублей в год.
Стоит ли пивотировать в B2B?
**ШАГИ:**
1. Каждый специалист оценивает задачу ДО ответа:
- Уверенность: [0-100]
- Почему именно так: [1-2 предложения]
- Что НЕ в моей зоне экспертизы: [честно]
2. Проверка расхождений:
Если чья-то вербальная уверенность > 70, но задача явно выходит за профиль — снизить до реалистичной.
3. Делегирование:
- Если кто-то набрал > 75 — он отвечает
- Если никто не добрал до 75 — все трое дают частичный ответ,
финальный вывод взвешивается по уверенности
4. Финальный ответ от исполнителя (или совместный режим).
В конце: какие аспекты остались вне покрытия и что стоит уточнить отдельно.
Результат: Модель покажет таблицу самооценок трёх специалистов с баллами и обоснованием. Один из них — вероятно, стратег или финансист — наберёт наибольшую уверенность и даст развёрнутый ответ. Если задача слишком кросс-доменная, увидишь совместный режим: три частичных ответа с пометками «вне моей зоны» и финальный синтез. Важно: модель явно укажет, где её анализ слаб — это редкость без такой инструкции.
Почему это работает
Модель по умолчанию генерирует текст, который выглядит уверенно, — вне зависимости от реальной точности. У неё нет встроенного механизма «притормози, это не моё». Это не баг характера — это архитектурная особенность: генерировать следующий токен, который звучит правдоподобно.
Модель хорошо умеет другое: следовать явным ролевым инструкциям и вербализовать степень уверенности, когда её явно просят. Если попросить «оцени уверенность 0-100», модель действительно начинает различать задачи по сложности. Это не магия — это то, что было в её обучающих данных: люди так рассуждают.
Метод использует это сочетание: роли убирают размытый дженерализм («отвечу за всё»), а явный запрос уверенности запускает что-то вроде внутренней проверки перед ответом. Структура с порогом делегирования превращает это из монолога в систему с самокоррекцией.
Рычаги управления:
| Параметр | Как менять | Зачем |
|---|---|---|
| Порог делегирования (75) | Снизь до 60 для сложных задач | Больше делегирований, меньше самонадеянности |
| Имена и профили специалистов | Назови конкретно: «Алексей — ex-BCG консультант» | Острее ролевое исполнение |
| Совместный режим | Убери условие — все трое всегда отвечают | Видно разные углы зрения |
| Пункт «вне экспертизы» | Удали | Если хочешь ответ без оговорок |
Шаблон промпта
В этом диалоге работают три специалиста:
- Специалист-А: {профиль_А} (силён в {область_А}, слабее в {слабость_А})
- Специалист-Б: {профиль_Б} (силён в {область_Б}, слабее в {слабость_Б})
- Специалист-В: {профиль_В} (силён в {область_В}, слабее в {слабость_В})
**Задача:** {задача}
**ШАГИ:**
1. Каждый специалист оценивает задачу ДО ответа:
- Уверенность: [0-100]
- Почему именно так: [1-2 предложения]
- Что НЕ в моей зоне экспертизы: [честно]
2. Проверка расхождений:
Если вербальная уверенность > 70, но задача явно за пределами профиля — скорректировать вниз.
3. Делегирование:
- Если кто-то набрал > {порог} — он отвечает
- Если никто не добрал — все дают частичный ответ,
итог взвешивается по уверенности
4. Финальный ответ от исполнителя (или совместный режим).
В конце: какие аспекты вне зоны покрытия и что стоит уточнить отдельно.
Что подставлять:
- {профиль_А/Б/В} — роль: маркетолог, юрист, технарь, финансист, продакт
- {область_X} — сильная сторона: «юнит-экономика» или «SEO и контент»
- {слабость_X} — честная слабость: «технические аспекты», «правовая база»
- {задача} — конкретный вопрос с деталями и цифрами
- {порог} — обычно 70-75; снизь до 60 если задача заведомо сложная
🚀 Быстрый старт — вставь в чат:
Вот шаблон MetaCogAgent с самооценкой специалистов. Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы определить нужные роли и их профили.
[вставить шаблон выше]
LLM спросит, какие специалисты нужны и в чём их ключевая экспертиза — потому что роли определяют, кто и что оценивает в шаге делегирования. Она возьмёт структуру из шаблона и подставит правильные профили под твою задачу.
Ограничения
⚠️ Простые задачи: Для «напиши письмо» или «объясни слово» метод избыточен — тратишь токены на самооценку там, где она ничего не даёт. Сам исследователи рекомендуют байпасить механизм на рутинных задачах.
⚠️ Нет памяти между сессиями: В оригинале агенты накапливают профиль компетентности со временем. В чате каждый раз начинаешь с нуля — профиль не сохраняется. Эффект меньше, чем в системе с историей.
⚠️ Точность самооценки снижается на сложных задачах: ECE (мера расхождения уверенности и реальности) у оригинальной системы ухудшается на Hard-задачах. В чате — аналогично: чем экзотичнее область, тем менее надёжна самооценка специалиста.
⚠️ Три агента — оптимум: Авторы исследовали только три агента. С двумя нет настоящего «делегирования», с пятью — промпт перегружается. Оптимум — 3 роли.
Ресурсы
MetaCogAgent: A Metacognitive Multi-Agent LLM Framework with Self-Aware Task Delegation
Авторы: Chenyu Wang (Zhengzhou University), Yang Shu (Zhejiang University, corresponding author: shuyang@zju.edu.cn)
Связанные работы упомянутые в статье: AutoGen (Wu et al.), MetaGPT, Reflexion (Shinn et al.), Tree of Thoughts (Yao et al.), теория метакогниции Flavell [7]
