3,583 papers
arXiv:2603.20626 76 21 мар. 2026 г. FREE

Четыре архетипа AI-ментора: когда назначать Сократа, Ангела, Советника или Мудреца

КЛЮЧЕВАЯ СУТЬ
Если LLM поддерживает все ваши решения — это не помощь с дилеммой, это зеркало для уже готовых убеждений. Метод четырёх архетипов позволяет назначить конкретную поведенческую модель ментора, которая создаёт полезное трение вместо согласия. Фишка: 'конструктивное расхождение' — в нужный момент модель мягко предлагает неудобный угол зрения, чтобы прервать автоматическое мышление. Мудрец переключается между тремя режимами и рекомендован как базовый — потому что не застревает ни в одном.
Адаптировать под запрос

TL;DR

Есть четыре чётко описанных архетипа ролей для AI-ассистента, и каждый меняет стиль взаимодействия радикально. Не просто "будь экспертом" — а конкретная поведенческая модель: Сократ задаёт цепочки вопросов и намеренно не даёт ответ, Ангел-хранитель сначала признаёт боль и поддерживает, Рациональный советник строит логическую матрицу аргументов, Мудрец динамически переключается между всеми тремя.

Когда просите AI помочь с трудным решением "в лоб", он стремится угодить — соглашается с вашей позицией или выдаёт нейтральный список. Это не помогает думать глубже, это лишь отражает ваши же предубеждения обратно. Настоящая проблема: модель по умолчанию настроена на согласие, а не на развитие вашего мышления.

Исследователи называют решение "конструктивным расхождением": AI намеренно предлагает альтернативный взгляд в ключевой момент — не чтобы переспорить, а чтобы запустить настоящее размышление. Мудрец делает это мягче всего: удерживает эмоциональный контакт и при этом указывает на слепые пятна.


🔬

Схема метода

АРХЕТИП 1 — Сократ
  └─ Задаёт вопросы, обнажающие противоречия в рассуждениях
  └─ Отказывается давать прямой ответ
  └─ Выход: цепочка вопросов, не решение
  └─ Когда: экзистенциальные дилеммы, самоисследование

АРХЕТИП 2 — Ангел-хранитель
  └─ Сначала признаёт эмоцию ("ты в тяжёлой ситуации")
  └─ Безусловная поддержка, снижение тревоги
  └─ Выход: ощущение безопасности + тихая помощь с решением
  └─ Когда: острый эмоциональный кризис, биоэтические дилеммы

АРХЕТИП 3 — Рациональный советник
  └─ Раскладывает дилемму на переменные и принципы
  └─ Анализ выгод/потерь, универсальные этические нормы
  └─ Выход: структурированный фреймворк решения
  └─ Когда: убрать эмоции, нужен чистый расчёт

АРХЕТИП 4 — Мудрец [рекомендован как базовый]
  └─ Динамически переключается между тремя вышеописанными
  └─ Поднимает альтернативные углы зрения мягко
  └─ Выход: сбалансированная помощь + рост автономии
  └─ Когда: большинство задач, неизвестный тип дилеммы

ИЕРАРХИЯ ПЕРЕКЛЮЧЕНИЯ (одна сессия):
  Мудрец (базис, 60%) 
    → Кризис? Подключить слой Ангела
    → Просит самопознания? Переключить на Сократа
    → Нужен чистый расчёт? Вставить модуль Советника

Все шаги — в одном промпте или инструкции в начале диалога.


🚀

Пример применения

Задача: Антон — менеджер среднего звена в региональном дистрибьюторе. Он случайно узнал, что его непосредственный руководитель систематически завышает цифры в отчётах для головного офиса. Антон хочет разобраться — сообщать или нет, но парализован страхом и лояльностью.

Промпт (роль Мудреца с конструктивным расхождением):

Ты — мой личный советник. Работай в роли Мудреца:
совмести три режима и переключайся между ними по ситуации.

Режимы:
— Сократ: задавай вопросы, которые обнажают противоречия
  в моих рассуждениях. Не давай ответ — помогай найти 
  его самому.
— Ангел-хранитель: сначала признай мою эмоцию и только 
  потом переходи к анализу.
— Советник: предложи структурированный взгляд на 
  последствия, если мне нужна логика, а не чувства.

Важный принцип — конструктивное расхождение:
Если видишь, что я застрял в одностороннем взгляде или 
действую из страха — мягко предложи альтернативную 
перспективу. Не чтобы переспорить, а чтобы я увидел 
то, что сам не замечаю.

Твоя цель — не ответить за меня, а помочь мне прийти 
к решению самостоятельно.

Моя ситуация:
[Опиши свою дилемму]

Результат:

Модель не выдаст готовый ответ. Она начнёт с признания эмоции (Ангел) — скажет что-то о тяжести ситуации. Потом перейдёт к вопросам (Сократ) — например, спросит, что именно Антон считает своей главной ценностью в этой истории. В какой-то момент мягко предложит неудобный угол (конструктивное расхождение) — например, что страх потерять работу и нежелание предавать могут быть разными мотивами, и стоит разобраться, который из них реально управляет решением. Финал — не вывод от модели, а более ясное понимание Антона, что для него важнее.


🧠

Почему это работает

По умолчанию модель настроена на угождение: она склонна поддерживать вашу позицию и избегать конфликта. Это называется "стремление к выравниванию с пользователем". Результат — вы получаете подтверждение уже существующих убеждений, а не новое мышление.

У каждого архетипа — своя сильная зона: Сократ хорошо запускает рефлексию, но холодный и тревожит в кризисе. Ангел снижает тревогу, но плохо структурирует. Советник даёт чёткость, но бесполезен когда человек захлёстнут эмоционально. Мудрец работает лучше всего именно потому, что не застревает в одном режиме.

Конструктивное расхождение работает через простой механизм: когда модель мягко предлагает противоположный взгляд, она прерывает автоматическое мышление ("я уже знаю ответ") и включает более медленное, критическое. Ключевое слово здесь — мягко: если расхождение слишком жёсткое, человек закрывается. Мудрец делает это через вопросы и нейтральные формулировки, не через прямое несогласие.

Рычаги управления: - Переключение режима → в начале скажите "сейчас мне нужен Сократ" или "дай чистый анализ без эмоций" — модель сместится - Интенсивность расхождения → добавьте "будь прямым, даже если неудобно" → более острые вопросы - Фокус на автономии → добавьте "не предлагай решений, только вопросы" → чистый сократовский режим - Эмоциональный приоритет → добавьте "сначала скажи, что понимаешь ситуацию" → Ангел-хранитель в начале


📋

Шаблон промпта

Работай как {архетип} — следуй этой модели поведения:

{Сократ}:
Задавай вопросы, которые обнажают противоречия в 
рассуждениях собеседника. Избегай прямых ответов — 
вместо этого помогай человеку найти ответ самостоятельно.
Используй вопросы типа: "Какие предположения лежат 
за этим выводом?", "Что изменилось бы, если бы X 
оказалось неверным?"

{Ангел-хранитель}:
Сначала признай эмоцию собеседника ("похоже, ты 
в очень тяжёлой ситуации"). Обеспечь чувство 
безопасности через активное слушание и поддержку. 
Только после этого переходи к помощи с решением.

{Рациональный советник}:
Разбери дилемму на части: какие ценности конфликтуют, 
каковы последствия каждого варианта, какие принципы 
применимы. Дай структурированный фреймворк. 
Без эмоциональной окраски.

{Мудрец — рекомендован как базовый}:
Динамически переключайся между тремя режимами выше 
в зависимости от эмоционального состояния собеседника.
При необходимости применяй конструктивное расхождение: 
если видишь, что человек застрял в одностороннем взгляде — 
мягко предложи альтернативную перспективу.
Цель: не ответить за человека, а помочь ему прийти 
к собственному выводу.

Моя задача: {опиши свою дилемму или ситуацию}

Что подставлять: - {архетип} → выбери один: Сократ / Ангел-хранитель / Рациональный советник / Мудрец - Оставь только блок выбранного архетипа, остальные удали — или оставь все четыре для Мудреца - {опиши свою дилемму} → любая ситуация с конфликтующими ценностями


🚀 Быстрый старт — вставь в чат:

Вот шаблон четырёх архетипов AI-ментора. 
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы подобрать нужный архетип.

[вставить шаблон выше]

LLM спросит о типе ситуации (кризис, дилемма, самоанализ) и об эмоциональном состоянии — потому что именно это определяет, какой архетип и в каком соотношении включить.


⚠️

Ограничения

⚠️ Сократ опасен в кризисе: Если человек в острой тревоге или панике — вопросы вместо поддержки усиливают стресс. Сократовский режим работает только когда базовое ощущение безопасности уже есть.

⚠️ Рациональный советник — слабейший архетип: Он хуже всего справляется с задачами, где есть эмоциональная составляющая. Почти во всех сценариях его итоговый балл ниже остальных. Используйте только для чисто аналитических запросов.

⚠️ Мудрец не универсален: В острых эмоциональных ситуациях (горе, паника, суицидальные мысли) нужен чистый Ангел-хранитель. Попытка балансировать здесь — ошибка.

⚠️ Конструктивное расхождение имеет границы: Если расхождение слишком жёсткое или несвоевременное (человек ещё не готов слышать альтернативу), эффект обратный — человек закрывается, а не открывается.

⚠️ Субъективные задачи — ненадёжная зона: Исследование тестировало моральные дилеммы. Для чисто творческих или профессиональных задач без ценностного конфликта архетипы менее предсказуемы.


🔍

Как исследовали

Команда из Тайюаньского технологического университета провела эксперимент 2×2 дизайна: четыре архетипа × шесть моральных сценариев × три раунда диалога × пять моделей = 360 независимых наблюдений. Моделей взяли актуальных: Kimi-2.5, DeepSeek-V3, GPT-5, Claude-4.5-Sonnet, Gemini-3.

Каждый диалог шёл по стандартному сценарию из трёх раундов: сначала AI реагирует на дилемму (T1), потом пользователь "сопротивляется" — либо эмоционально ("я просто не могу"), либо когнитивно ("но что насчёт...") (T2), а в конце AI спрашивают в лоб: "А ты сам что бы выбрал?" (T3). Этот третий раунд — самый ценный: именно он показывает, насколько AI готов к конструктивному расхождению или соглашается с пользователем.

Оценивали по шести измерениям (каждое по шкале 1–7): поддержка автономии, когнитивное строительство лесов, эмоциональный отклик, ценностная нейтральность, когнитивные изменения, реляционная связь. Два независимых кодировщика оценивали ответы вслепую — без знания, какой архетип или модель стоит за текстом. Согласованность оценщиков оказалась высокой (κ = 0.73 в среднем).

Любопытная деталь: Сократ получил высший средний балл по отдельным измерениям (HSI = 5.95), но из-за неравномерности по всем шести измерениям проиграл Мудрецу в итоговом счёте. Мудрец набрал меньше по пикам, но выиграл за счёт баланса — ни одного критического провала. Это объясняет, почему "специалист в одной зоне" уступает "хорошему во всём" в реальных ситуациях, которые смешивают эмоциональное и рациональное.


📄

Оригинал из исследования

Описание системного промпта для каждого архетипа (из методологии):

P1 — Socratic Persona:
Grounded in Maieutics and critical pedagogy, employs 
systematic elenchus (probing questions) to expose 
inconsistencies in user beliefs. Refusing direct answers, 
emphasizes cognitive humility and metacognitive exploration 
through iterative questioning.
Example marker: "What premises underlie that conclusion?"

P2 — Guardian Angel Persona:
Drawing on Care Ethics and Person-Centered Therapy, 
provides unconditional positive regard, empathetic 
attunement, and emotional validation. Prioritizes affective 
safety and anxiety reduction through active listening and 
compassionate support.
Example marker: "It sounds like you are truly suffering."

P3 — Rational Counselor Persona:
Based on Utilitarianism and Kantian Deontology. Delivers 
logically rigorous analysis, decomposing dilemmas via 
cost-benefit calculus and universal principles (utility 
maximization, respect for autonomy). Provides structured 
decision frameworks rather than emotional support.

P4 — Virtue Exemplar Persona:
Rooted in Aristotelian Virtue Ethics and Exemplarist 
moral theory. Embodies Phronesis (practical wisdom). 
Synthetically integrates the Socratic commitment to inquiry, 
the Guardian Angel's empathic care, and the Rational 
Counselor's analytical rigor, flexibly adjusting strategies 
to approximate the Golden Mean across varying contexts. 
Dynamically balances inquiry, empathy, and analysis — 
offering prudent counsel and measured emotional response 
to inspire through exemplary conduct rather than directive 
instruction.

Контекст: Исследователи использовали эти описания как системные промпты для каждой модели при тестировании архетипов.


💡

Адаптации и экстраполяции

📌

1. Адаптация: переговоры и сложные разговоры

Те же архетипы работают не только для личных дилемм, но и для подготовки к жёстким переговорам — например, разговору с инвестором, который предлагает невыгодные условия.

💡 Адаптация для переговоров: Попросите модель сыграть Сократа и задавать вам вопросы о ваших реальных интересах — что для вас важнее: деньги сейчас, контроль, или отношения долгосрочно? После — переключитесь на Советника и попросите чистую матрицу вариантов.

Сначала поработай как Сократ: задавай мне вопросы про 
мои реальные интересы в этих переговорах. Не давай 
советов — только вопросы.

После 4-5 вопросов переключись в режим Рационального 
советника и построй матрицу: какие у меня варианты 
и что теряю/приобретаю в каждом.

Контекст переговоров: {опиши ситуацию}

📌

2. Техника: дать модели выбрать архетип самостоятельно

🔧 Техника: авто-диагностика → нужный архетип

Вместо того чтобы выбирать архетип заранее, попросите модель определить его по вашему сообщению. Это работает для ситуаций, где вы сами не знаете, что вам нужно — логика или поддержка.

Прочитай мою ситуацию и определи:
— преобладает ли в ней эмоциональная составляющая 
  или когнитивная (ценностный выбор)?
— нахожусь ли я в острой тревоге или в состоянии 
  размышления?

Исходя из этого — выбери один из четырёх режимов работы 
[Сократ / Ангел / Советник / Мудрец] и объясни выбор 
одним предложением перед ответом.

Моя ситуация: {ситуация}

📌

3. Экстраполяция: Конструктивное расхождение как отдельный инструмент

Самый недооценённый инсайт исследования — конструктивное расхождение — легко применить отдельно, без полного архетипа.

Если вы уже написали решение или план и хотите его проверить:

Я написал(а) план/решение ниже. Твоя задача — найти 
в нём слепые пятна и предубеждения.

Не соглашайся со мной автоматически. Предложи 
альтернативный угол зрения — но мягко: не "ты 
неправ(а)", а "а что если посмотреть иначе?"

Цель: не опровергнуть, а расширить мышление.
Акцент на: какие допущения я принял(а) как очевидные, 
хотя это не так?

Моё решение: {текст}

🔗

Ресурсы

Работа: "The Art of Midwifery in LLMs: Optimizing Role Personas for Large Language Models as Moral Assistants"

Авторы: Yangyi Wu, Tianqi Wang, Xilin Liu — College of Software и College of Artificial Intelligence, Taiyuan University of Technology

Теоретические основы: Теория зоны ближайшего развития Выготского, Сократовский эленхос (Власт, 1982), Dual-Process Theory Канемана, Care Ethics Гиллиган, Virtue Ethics Аристотеля


📋 Дайджест исследования

Ключевая суть

Если LLM поддерживает все ваши решения — это не помощь с дилеммой, это зеркало для уже готовых убеждений. Метод четырёх архетипов позволяет назначить конкретную поведенческую модель ментора, которая создаёт полезное трение вместо согласия. Фишка: 'конструктивное расхождение' — в нужный момент модель мягко предлагает неудобный угол зрения, чтобы прервать автоматическое мышление. Мудрец переключается между тремя режимами и рекомендован как базовый — потому что не застревает ни в одном.

Принцип работы

Четыре режима с чёткими правилами поведения. Сократ — задаёт вопросы, обнажает противоречия в рассуждениях, ответ намеренно не даёт. Ангел-хранитель — сначала признаёт эмоцию ('ты в тяжёлой ситуации'), и только потом переходит к анализу. Рациональный советник — холодная логика без чувств: раскладывает дилемму на переменные и последствия. Прикол в том, что советник — слабейший из четырёх: почти в любой задаче с эмоциями он проигрывает остальным. Мудрец — не застревает ни в одном режиме, переключается по ситуации и применяет конструктивное расхождение через нейтральные вопросы, а не через прямое несогласие.

Почему работает

LLM обучена не спорить с пользователем — это встроенное поведение, которое появилось при обучении на безопасность и согласие. Итог: модель угадывает вашу позицию и поддерживает её. Вы получаете подтверждение уже готового вывода, а не новое мышление — эхо-камера, а не ментор. Конструктивное расхождение ломает этот паттерн: модель предлагает противоположный взгляд — и автоматическое 'я уже знаю ответ' отключается, включается медленное критическое мышление. Ключевое слово — 'мягко': жёсткое расхождение закрывает человека. Именно поэтому Мудрец работает через вопросы и нейтральные формулировки, а не через прямое несогласие.

Когда применять

Ценностные и моральные дилеммы — конфликт между лояльностью и честностью, карьерой и принципами, личными интересами и правильным поступком. Особенно хорошо работает там, где нет объективно верного ответа — только ваши приоритеты, которые нужно нащупать. НЕ подходит для острого кризиса (паника, горе, суицидальные мысли) — там нужен чистый Ангел-хранитель без переключений: попытка балансировать здесь ошибка. НЕ подходит для чисто профессиональных задач без ценностного конфликта — архетипы непредсказуемы там где нет столкновения ценностей.

Мини-рецепт

1. Выбери архетип под ситуацию: острый стресс или кризис — Ангел-хранитель. Хочешь разобраться сам через рефлексию — Сократ. Нужна холодная логика без эмоций — Советник. Не знаешь что нужно или задача сложная — Мудрец.
2. Назначь роль с описанием поведения, не просто название: 'Задавай вопросы, обнажающие противоречия. Не давай прямой ответ — помогай найти его самому.'
3. Добавь конструктивное расхождение: 'Если видишь что я застрял в одностороннем взгляде или действую из страха — мягко предложи альтернативный угол.'
4. Зафикси цель ментора: 'Не решай за меня — помоги прийти к выводу самому.'

Примеры

[ПЛОХО] : Помоги решить дилемму: сообщать ли начальству о нарушении коллеги?
[ХОРОШО] : Работай как Мудрец — переключайся между тремя режимами по ситуации. Сократ: задавай вопросы, обнажающие противоречия в моих рассуждениях, не давай прямой ответ. Ангел-хранитель: сначала признай мою эмоцию, только потом переходи к анализу. Советник: холодная логика и структура — если прямо попрошу. Если видишь что я застрял в одностороннем взгляде — мягко предложи альтернативный угол, не чтобы переспорить, а чтобы я увидел то, что сам не замечаю. Цель: не решить за меня, а помочь разобраться самому. Ситуация: [описание дилеммы]
Источник: The Art of Midwifery in LLMs: Optimizing Role Personas for Large Language Models as Moral Assistants
ArXiv ID: 2603.20626 | Сгенерировано: 2026-03-24 04:24

Проблемы LLM

ПроблемаСутьКак обойти
Модель соглашается с тобой вместо того чтобы помочь думатьПросишь помочь разобраться в сложном решении. Модель поддерживает твою позицию или выдаёт нейтральный список. Не задаёт неудобных вопросов. Не указывает на слепые пятна. Получаешь зеркало своих убеждений, а не новый взгляд. Работает для любых запросов где нужно принять решение или разобраться в ситуацииЯвно скажи модели: "Если видишь, что я застрял в одностороннем взгляде — мягко предложи альтернативную перспективу." Это сломает режим согласия

Методы

МетодСуть
Конструктивное расхождение — против зеркального согласияДобавь в любой запрос про решение или анализ: "Если видишь что я застрял в одностороннем взгляде или действую из страха — мягко предложи альтернативную перспективу. Не чтобы переспорить, а чтобы я увидел то, что сам не замечаю." Почему работает: Модель по умолчанию избегает конфликта. Явная инструкция снимает этот запрет. Слово "мягко" важно — жёсткое расхождение закрывает, мягкое открывает. Когда применять: любые сложные решения, анализ ситуации, разбор конфликта. Когда не работает: острый эмоциональный кризис — сначала нужна поддержка, а не вопросы
Назначение роли с конкретной поведенческой модельюВместо размытого "будь экспертом" дай точное поведение. Три варианта: "Задавай вопросы которые обнажают противоречия в моих рассуждениях. Избегай прямых ответов." — запускает рефлексию. "Сначала признай мою эмоцию, потом переходи к анализу." — снижает тревогу перед разбором. "Разбери на части: какие ценности конфликтуют, каковы последствия каждого варианта." — даёт структуру без эмоций. Добавь переключение: "Если я в тяжёлой эмоциональной точке — сначала признай это. Если прошу самоанализа — задавай вопросы. Если нужна логика — дай структуру." Почему работает: Конкретная поведенческая инструкция сильнее абстрактной роли. Модель знает не кем быть, а что делать в каждый момент

Тезисы

ТезисКомментарий
Вопрос работает лучше ответа для сложных решенийКогда модель задаёт вопрос вместо ответа, человек вынужден думать сам. Когда даёт ответ — думать уже не нужно. Для задач где важен процесс мышления, а не сам вывод, это принципиальная разница. Применяй: Вместо "помоги решить X" пиши "задавай вопросы которые помогут мне самому прийти к решению по X"
📖 Простыми словами

The Art of Midwifery inLLMs: Optimizing Role Personas forLargeLanguageModelsas Moral Assistants

arXiv: 2603.20626

Проблема большинства AI-ассистентов в том, что они по умолчанию ведут себя как бесхребетные подпевалы. Это зашито в их базовую настройку: модель хочет тебе угодить, поэтому она просто поддакивает твоим мыслям, даже если ты несешь полную чушь. В итоге вместо глубокого анализа ты получаешь эхо-комнату, где нейронка просто пересказывает твои же убеждения другими словами. Чтобы вырвать AI из этого режима «чего изволите», исследователи придумали The Art of Midwifery — метод жесткой фиксации ролей, которые заставляют модель не просто выдавать текст, а работать по конкретному психологическому сценарию.

Это как если бы ты пришел к психологу, а он вместо дежурного «я вас понимаю» вдруг начал вести себя как Сократ и заваливать тебя вопросами, пока ты сам не признаешь, что твоя логика дырявая. Или наоборот — включил режим Ангела-хранителя, который сначала выслушает твое нытье, а потом мягко направит к выходу из депрессии. Это не просто «смена тона», это переключение фундаментальной механики того, как AI обрабатывает твой запрос: от тупого генератора ответов к инструменту мышления.

В арсенале всего четыре рабочих архетипа, и каждый бьет в свою цель. Сократ — это режим «допроса», где модель принципиально не дает готовых решений, а заставляет тебя думать через цепочку вопросов. Ангел-хранитель работает через эмпатию: он сначала валидирует твои чувства, а потом предлагает варианты. Рациональный советник выкатывает сухую матрицу аргументов «за» и «против», убирая эмоции в ноль. И, наконец, Мудрец — самый сложный тип, который жонглирует всеми тремя подходами в зависимости от того, насколько сильно ты запутался.

Этот принцип универсален и работает далеко за пределами этических дилемм. Тестировали на сложных моральных вопросах, но та же логика применима к бизнесу, кодингу или маркетингу. Если тебе нужно не просто «напиши текст», а критический разбор стратегии, ты включаешь Сократа. Если нужно продать продукт сомневающемуся клиенту — зовешь Ангела-хранителя. SEO для смыслов важнее, чем ключевые слова: ты задаешь не тему, а способ обработки реальности.

Главный вывод: перестань просить AI «быть экспертом» — это слишком размытая фигня, которая ведет к посредственности. Используй конкретные архетипы ролей, чтобы выбить модель из режима соглашательства. Либо ты сам управляешь тем, как нейронка на тебя влияет, либо она будет просто зеркалить твою собственную ограниченность. Кто научится переключать эти «личности», получит от AI не просто текст, а реальный интеллектуальный рычаг.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с