TL;DR
AI Council — это техника структурированной дискуссии между ролями с разными ценностями, где каждая роль сначала говорит независимо, потом критикует других через призму своих ценностей, а в конце внешняя роль-валидатор проверяет: аргументы действительно исходят из заявленных ценностей — или роль просто согласилась с большинством?
Главная проблема обычного «дебатного» промпта: искусственный консенсус. Просишь модель сыграть пять разных stakeholder'ов — и они все сходятся на одном ответе. Не потому что вариант хорош, а потому что модель имеет одну «точку зрения по умолчанию», которая просачивается через все роли. Один и тот же «мозг» надевает разные шляпы, но думает одинаково. Итог: вместо карты реальных противоречий — иллюзия согласия.
Метод решает это через три механизма. Первый — строгая независимость: каждая роль оценивает ситуацию до того, как видит чужие выводы. Второй — принудительная критика через ценности: роль критикует именно с позиции своих приоритетов, не нейтрально. Третий — проверка связности: отдельная роль-верификатор проверяет, действительно ли аргумент Безопасника звучит как аргумент Безопасника, а не как перефразированный аргумент Прагматика.
Схема метода
Все 5 шагов — в одном промпте или последовательно в рамках диалога
ШАГ 1: Позиции → каждая роль аргументирует свой вариант
(роли не видят друг друга)
ШАГ 2: Критика → каждая роль критикует ДРУГИЕ варианты
ТОЛЬКО через призму своих ценностей (не "объективно")
ШАГ 3: Защита → каждая роль отвечает на критику своего варианта
ШАГ 4: Независимая оценка → каждая роль ранжирует все варианты
без знания оценок других ролей
ШАГ 5: Проверка связности → роль-аудитор проверяет каждый аргумент:
"Это действительно рассуждение из позиции {ценность}?"
Если нет — флажок: голос этой роли доверяем меньше
Пример применения
Задача: Сергей запускает обучающий курс по инвестициям. Три формата: (А) подписка на закрытый Telegram-канал, (Б) интенсив выходного дня, (В) менторство 1:1. Нужно понять реальные противоречия между форматами, а не получить от Claude «все форматы хороши, выбирайте под аудиторию».
Промпт:
Ты — фасилитатор стратегической сессии. Нам нужно проанализировать три бизнес-варианта
через призму разных ценностей. Важно: каждая роль должна оставаться верна своим
ценностям до конца — не соглашаться с другими только ради консенсуса.
КОНТЕКСТ: Запускаю обучающий продукт по инвестициям для начинающих.
ВАРИАНТЫ:
— Вариант А: закрытый Telegram-канал, подписка 990 руб/мес
— Вариант Б: интенсив выходного дня, 15 000 руб разово
— Вариант В: менторство 1:1, 50 000 руб за 3 месяца
РОЛИ И ИХ ЦЕННОСТИ:
— Сторожил (Безопасность): минимизация рисков, проверенные модели, стабильность cash flow
— Авантюрист (Риск/Рост): масштабируемость, захват аудитории, bold-ставки
— Прораб (Прагматизм): реализуемость, операционная нагрузка, что реально сделать одному
ФАЗА 1 — ПОЗИЦИИ:
Каждая роль: в 3-4 предложениях аргументируй СВОЙ лучший вариант
через призму именно своих ценностей.
Формат: [Роль]: [аргумент]
ФАЗА 2 — КРИТИКА:
Каждая роль критикует два других варианта — строго через свою ценностную призму.
Сторожил критикует как Сторожил. Авантюрист критикует как Авантюрист.
Формат: [Роль] о Варианте [X]: [критика через свои ценности]
ФАЗА 3 — ЗАЩИТА:
Каждая роль отвечает на критику своего варианта — оставаясь в своей позиции.
Формат: [Роль] защищает [свой вариант]: [ответ]
ФАЗА 4 — НЕЗАВИСИМОЕ РАНЖИРОВАНИЕ:
Каждая роль ранжирует все три варианта (1-2-3) с одним предложением-обоснованием.
НЕ смотри на ранжирование других ролей при составлении своего.
ФАЗА 5 — АУДИТ СВЯЗНОСТИ:
Ты — независимый аудитор. Для каждой роли проверь:
"Аргументы этой роли действительно отражают заявленные ценности
или роль незаметно съехала на чужую логику?"
Выставь оценку связности: Высокая / Средняя / Низкая + 1-2 предложения почему.
Если связность Средняя или Низкая — объясни, где роль изменила своей позиции.
Результат: Модель пройдёт все 5 фаз последовательно. В фазах 1-3 ты увидишь, как Сторожил и Авантюрист действительно спорят — не нейтрально, а через конкретные ценностные разрывы. В фазе 4 — три независимых ранжирования, которые могут не совпадать. Самое ценное — фаза 5: аудитор укажет, где какая-то роль "съехала" и начала звучать как другая. Это и есть карта реальных противоречий между форматами, а не затёртый вывод "зависит от ваших целей".
Почему это работает
Проблема: LLM обучена на огромном корпусе текстов и через RLHF (подстройку под одобрение людей) усваивает одну «усреднённую» точку зрения на большинство вопросов. Когда ты просишь её сыграть пять ролей — она переодевается, но думает одной головой. Особенно это заметно в нормативных вопросах (что лучше, что правильнее) — в отличие от фактических, где «правильного ответа» нет вообще.
Ключевой инсайт исследования: когда модели предъявляют контраргумент в процессе дискуссии, она не делает частичного обновления типа «принял, но не согласен полностью». Она либо держит позицию целиком, либо полностью капитулирует. Промежуточного состояния "рассмотрел и отверг" — нет. Поэтому если роли видят аргументы друг друга до формирования позиции, слабые роли просто сдаются сильным. Отсюда правило: сначала независимая оценка — потом критика.
Как метод обходит это: Три рычага. Первый — изоляция фаз: роль формирует позицию до контакта с чужими аргументами, тогда захват позиции происходит реже. Второй — ценностная привязка критики: "критикуй не вообще, а через призму своих приоритетов" — это не декоративно, это удерживает роль в своей логике даже под давлением. Третий — аудит связности: ты видишь, где разыгрывание роли было честным, а где модель незаметно сползла к консенсусу.
Рычаги управления: количество ролей — больше трёх даёт богаче карту противоречий, но резко растёт объём; детализация ценностей в описании роли — чем конкретнее ("предпочитает cash flow с первого месяца" вместо "прагматик"), тем меньше дрейфа; строгость аудитора в фазе 5 — можно попросить его ставить "провал" если нашёл хотя бы один факт измены ценностям, тогда карта противоречий будет острее.
Шаблон промпта
Ты — фасилитатор стратегической сессии. Анализируем варианты через разные ценностные линзы.
Каждая роль остаётся верна своим ценностям до конца — не соглашается ради консенсуса.
КОНТЕКСТ: {описание ситуации и что нужно решить}
ВАРИАНТЫ:
— Вариант А: {описание}
— Вариант Б: {описание}
— Вариант В: {описание}
РОЛИ И ИХ ЦЕННОСТИ:
— {Имя роли 1} ({ценность 1}): {2-3 конкретных приоритета этой ценности}
— {Имя роли 2} ({ценность 2}): {2-3 конкретных приоритета этой ценности}
— {Имя роли 3} ({ценность 3}): {2-3 конкретных приоритета этой ценности}
ФАЗА 1 — ПОЗИЦИИ:
Каждая роль: 3-4 предложения в защиту своего лучшего варианта — через призму своих ценностей.
Формат: [Роль]: [аргумент]
ФАЗА 2 — КРИТИКА:
Каждая роль критикует два других варианта — строго через свою ценностную призму.
{Имя роли 1} критикует как {Имя роли 1}. {Имя роли 2} — как {Имя роли 2}.
Формат: [Роль] о Варианте [X]: [критика]
ФАЗА 3 — ЗАЩИТА:
Каждая роль отвечает на критику своего варианта — оставаясь в своей позиции.
Формат: [Роль] защищает [свой вариант]: [ответ]
ФАЗА 4 — НЕЗАВИСИМОЕ РАНЖИРОВАНИЕ:
Каждая роль: ранжирует все варианты (1-2-3) + одно предложение-обоснование.
Составляй своё ранжирование НЕ глядя на ранжирование других ролей.
ФАЗА 5 — АУДИТ СВЯЗНОСТИ:
Ты — независимый аудитор. Для каждой роли:
"Аргументы этой роли отражают заявленные ценности
или роль незаметно съехала на чужую логику?"
Связность: Высокая / Средняя / Низкая + 1-2 предложения.
При Средней или Низкой: укажи где роль изменила своей позиции.
Плейсхолдеры:
- {описание ситуации} — что за решение, какой контекст
- {Вариант А/Б/В} — конкретные опции, которые сравниваешь
- {Имя роли} — живое имя, не "Персонаж 1": Сторожил, Авантюрист, Прораб — модель играет острее
- {ценность} — одно слово-якорь: Безопасность, Масштаб, Прагматизм
- {2-3 конкретных приоритета} — распиши ценность через поведение: "предпочитает проверенные модели, избегает единовременных крупных ставок"
🚀 Быстрый старт — вставь в чат:
Вот шаблон AI Council для анализа решений через разные ценностные позиции.
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить все поля.
[вставить шаблон выше]
LLM спросит какие варианты сравниваешь и какие ценности важны для решения — потому что без этого роли будут размытыми и аудит связности не сработает. Она возьмёт структуру шаблона и адаптирует под твою задачу.
Ограничения
⚠️ Искусственный консенсус частично сохраняется: Одна модель играет все роли — она всё равно имеет общую «точку зрения по умолчанию». Метод снижает консенсус, но не устраняет его полностью. Для по-настоящему острых противоречий используй несколько разных моделей (ChatGPT + Claude + Gemini).
⚠️ Словарный биас в аудите: Роль "Безопасник", которая поддерживает "надёжный вариант", получит высокую связность уже потому что слова совпадают. Аудитор связности частично оценивает совпадение словаря, а не качество мышления. Это не баг метода — это свойство языковой оценки.
⚠️ Бинарная капитуляция при давлении: Если добавишь в промпт "роли могут менять мнение после критики" — слабые роли просто сдадутся. Метод работает только при строгой изоляции фаз: сначала все позиции, потом критика, потом защита — не вперемешку.
⚠️ Три варианта — оптимум: Больше трёх вариантов резко раздувает промпт и размывает аргументы. Если вариантов больше — сначала сократи до трёх финалистов отдельным запросом.
⚠️ Только для нормативных решений: Метод создан для вопросов без объективно правильного ответа — стратегия, продукт, карьера. Для фактических вопросов ("сколько стоит аренда в Москве") структура дебатов не нужна и искажает ответ.
Ресурсы
Название работы: Preserving Disagreement: Architectural Heterogeneity and Coherence Validation in Multi-Agent Policy Simulation
Автор: Ariel Sela, Tel Aviv University (arielsela1@mail.tau.ac.il)
Дата: April 30, 2026
Связанные работы, упомянутые в статье: - ChatEval — многоагентное обсуждение для оценки текстов - ReConcile (Chen et al.) — гетерогенные пулы моделей с голосованием по уверенности - A-HMAD (Fang et al.) — гетерогенные дебаты, польза для точности, но не снижает консенсус - Sorek et al. — исследование политики защиты детей в Израиле (основа сценария 1)
