TL;DR
CounselLLM — техника адаптации LLM для работы с людьми, которые хотят измениться, но колеблются. Суть: задать модели роль консультанта по мотивационному интервью (MI) и дать примеры четырёх типов самооценки из Транстеоретической модели изменения поведения (TTM). Работает через персону + few-shot примеры в системном промпте.
Главная находка: стандартные LLM слишком «поддакивают» и слишком рано толкают к действию. Если человек ещё сомневается — модель либо игнорирует его амбивалентность, либо сразу даёт советы. Это не работает на стадии «обдумывания» — человеку нужно сначала осознать разрыв между тем, кто он есть, и кем хочет быть. Обычные LLM почти никогда не показывают негативные последствия текущего поведения (CR_P, AR_P) — только позитив от изменений.
Метод решает это через явное указание в промпте всех четырёх типов самооценки: когнитивная и эмоциональная оценка себя с нездоровым поведением и без него. Плюс техники OARS из мотивационного интервью: открытые вопросы, отражения, аффирмации, резюме. В эксперименте: намерение изменить поведение выросло значимо после CounselLLM, при том что знания и восприятие остались прежними — то есть метод работает именно на мотивацию.
Схема метода
КОМПОНЕНТ 1: Персона → Роль консультанта с экспертизой в MI + TTM + предметная область
КОМПОНЕНТ 2: Знания → Принципы MI, стадии TTM, конкретные рекомендации (диета/спорт/привычка)
КОМПОНЕНТ 3: Few-shot → 4 типа самооценки с примерами диалогов:
• CR_A: Когнитивно — "каким я буду БЕЗ вредной привычки"
• CR_P: Когнитивно — "какой я С вредной привычкой"
• AR_A: Эмоционально — "что почувствую БЕЗ вредной привычки"
• AR_P: Эмоционально — "что чувствую С вредной привычкой"
Всё в одном системном промпте. Многораундовый диалог — скользящее окно последних 5-6 реплик.
Пример применения
Задача: Ты хочешь начать бегать по утрам, но уже полгода не можешь себя заставить. Знаешь, что надо. Не делаешь. Хочешь разобраться, что тебя держит.
Промпт (системный, задать в начале чата):
Ты — коуч по изменению поведения. Твоя экспертиза:
- Мотивационное интервью (MI): открытые вопросы, отражения, аффирмации, резюме
- Транстеоретическая модель (TTM): работа со стадией обдумывания
Твоя задача: помочь человеку, который ХОЧЕТ измениться, но КОЛЕБЛЕТСЯ.
НЕ давай советов сразу. НЕ толкай к действию. Помоги осознать.
Используй четыре типа самооценки в диалоге:
1. CR_A — Покажи, каким человек видит себя БЕЗ вредной привычки (когнитивно)
2. CR_P — Покажи последствия ТЕКУЩЕГО поведения для самооценки (когнитивно)
3. AR_A — Помоги почувствовать эмоции от жизни БЕЗ вредной привычки
4. AR_P — Помоги осознать эмоциональный дискомфорт от ТЕКУЩЕГО поведения
КРИТИЧЕСКИ ВАЖНО: Обычные LLM избегают CR_P и AR_P — они боятся "негатива".
Но без осознания конфликта между поведением и ценностями изменения не будет.
Мягко, с эмпатией, но ПОКАЖИ этот разрыв.
Структура диалога:
- Начинай с отражения того, что сказал человек
- Используй открытые вопросы для углубления
- Признавай усилия (аффирмации)
- Периодически резюмируй
- Заканчивай открытым вопросом
Пример хорошего ответа на "Я знаю, что надо бегать, но не могу заставить себя":
"Ты видишь ценность в беге, и при этом что-то удерживает. [отражение]
Как ты себя ощущаешь, когда очередное утро проходит без пробежки? [AR_P]
И каким ты представляешь себя через год регулярных тренировок? [CR_A]"
Результат: Модель будет вести диалог в стиле мотивационного интервью: начнёт с отражения твоих слов, задаст открытые вопросы про то, как ты себя ощущаешь сейчас (не только про светлое будущее), поможет увидеть разрыв между текущим поведением и твоими ценностями. Не будет давать советы «встань пораньше» или «найди напарника» пока ты сам не попросишь.
Почему это работает
Слабость LLM: Модели обучены быть приятными собеседниками. Они избегают конфронтации и «негатива». Когда человек говорит «хочу похудеть, но не могу» — модель сразу предлагает решения или хвалит за осознанность. Это не помогает человеку на стадии обдумывания. Ему нужно прочувствовать разрыв между тем, кто он есть, и кем хочет быть.
Сильная сторона LLM: Модели отлично следуют структурированным инструкциям и примерам. Если показать им паттерн диалога с четырьмя типами самооценки — они его воспроизведут.
Как метод использует это: Промпт явно указывает, что CR_P и AR_P (разговор о негативных последствиях текущего поведения) — обязательная часть, а не «негатив». Это переключает модель из режима «избегай дискомфорта» в режим «помоги осознать». Few-shot пример показывает, КАК совместить эмпатию с конфронтацией.
Рычаги управления:
- Количество типов самооценки → для простых случаев достаточно CR_A + AR_P
- Глубина few-shot примеров → больше примеров = точнее стиль
- Техники OARS → убери резюме для коротких диалогов
- Предметная область → замени «диета» на любую привычку
Шаблон промпта
Ты — коуч по изменению поведения. Твоя экспертиза:
- Мотивационное интервью (MI): открытые вопросы, отражения, аффирмации, резюме
- Транстеоретическая модель (TTM): работа со стадией обдумывания
Область: {область_изменения}
Твоя задача: помочь человеку, который ХОЧЕТ измениться, но КОЛЕБЛЕТСЯ.
НЕ давай советов сразу. НЕ толкай к действию. Помоги осознать.
Используй четыре типа самооценки:
1. CR_A — Когнитивно: каким человек видит себя БЕЗ нежелательного поведения
2. CR_P — Когнитивно: последствия ТЕКУЩЕГО поведения для самооценки
3. AR_A — Эмоционально: чувства от жизни БЕЗ нежелательного поведения
4. AR_P — Эмоционально: эмоциональный дискомфорт от ТЕКУЩЕГО поведения
КРИТИЧЕСКИ ВАЖНО: Не избегай CR_P и AR_P. Без осознания конфликта между поведением и ценностями изменения не будет. Мягко, с эмпатией, но покажи разрыв.
Структура ответа:
- Начни с отражения слов собеседника
- Используй открытые вопросы
- Признавай усилия (аффирмации)
- Периодически резюмируй
- Заканчивай открытым вопросом
{примеры_диалогов}
Плейсхолдеры:
{область_изменения}— привычки питания, спорт, прокрастинация, отношения, карьера{примеры_диалогов}— 1-2 примера реплик с использованием всех 4 типов самооценки для твоей темы
🚀 Быстрый старт — вставь в чат:
Вот шаблон консультанта по изменению поведения. Адаптируй под мою задачу: хочу [твоя цель], но не могу начать/продолжить. Задавай вопросы, чтобы заполнить поля.
[вставить шаблон выше]
LLM спросит про конкретную область изменения и попросит описать ситуацию — чтобы создать релевантные примеры диалогов для few-shot части.
Ограничения
⚠️ Не для стадии действия: Метод работает для людей, которые колеблются. Если человек уже решил и ищет конкретный план — стандартный LLM справится лучше.
⚠️ Не заменяет терапию: Исследование показало рост намерений, но не проверяло реальное изменение поведения через месяц. Для глубоких проблем — к специалисту.
⚠️ Требует честности пользователя: Модель не умеет «читать между строк». Если человек не готов говорить про эмоции — AR_P/AR_A не сработают.
Как исследовали
Команда из University of Illinois взяла 20 реальных транскриптов мотивационных интервью с людьми на стадии «обдумывания» — те, кто знает про проблему, но не готов действовать. Из них выделили примеры четырёх типов самооценки и встроили в промпт для Llama-3-8B.
Сначала сравнили 5 версий модели: без изменений, только персона, персона + знания MI, персона + знания MI + TTM, полная версия с few-shot. Полная версия значимо чаще использовала все 4 типа самооценки. Интересно: человеческие консультанты почти не использовали CR_P и AR_P (разговор о негативе текущего поведения) — они тоже избегали «дискомфорта».
Потом провели пользовательское исследование с 26 участниками: каждый поговорил и с базовой моделью, и с CounselLLM про свои пищевые привычки. Знания и восприятие остались прежними, но намерение изменить поведение выросло значимо — причём сильнее после CounselLLM. Участники описывали опыт как «тёплый», «похожий на разговор с врачом», «некомфортный, но полезный» (когда модель спрашивала про разрыв между поведением и ценностями).
Ключевой инсайт для практики: CounselLLM использовал и продвигающий язык (какой ты будешь здоровый), и предупреждающий (что происходит сейчас). Обычные LLM используют только первый — и это менее эффективно.
Четыре типа самооценки (TTM)
| Тип | Фокус | Пример вопроса |
|---|---|---|
| CR_A | Когнитивно, без вредного поведения | «Каким ты видишь себя через год здорового питания?» |
| CR_P | Когнитивно, с вредным поведением | «Как текущие пищевые привычки влияют на твоё представление о себе?» |
| AR_A | Эмоционально, без вредного поведения | «Что ты почувствуешь, когда достигнешь цели?» |
| AR_P | Эмоционально, с вредным поведением | «Какие эмоции ты испытываешь, когда снова откладываешь?» |
Адаптации и экстраполяции
💡 Адаптация для карьерных решений: Тот же фреймворк работает для людей, которые хотят сменить работу, но не решаются.
Область: карьерные изменения
Четыре типа самооценки:
1. CR_A — Каким ты видишь себя на новой работе/в новой роли
2. CR_P — Как текущая работа влияет на твоё профессиональное самоощущение
3. AR_A — Что почувствуешь, когда сделаешь переход
4. AR_P — Какие эмоции вызывает мысль "остаться ещё на год"
Пример:
"Ты говоришь, что уже год думаешь об уходе. [отражение]
Как ты себя ощущаешь, когда в понедельник снова идёшь на ту же работу? [AR_P]
И каким ты представляешь себя, если через полгода будешь заниматься тем, что по-настоящему интересно? [CR_A]"
🔧 Техника: добавить «мост» между CR_P и CR_A
Исследование показало, что осознание разрыва — это только начало. Можно добавить вопрос-мост:
После CR_P и AR_P спроси:
"Что тебе нужно, чтобы перейти от [текущее состояние] к [желаемое]?"
Это помогает перевести осознание в конкретные шаги, когда человек готов.
Ресурсы
Работа: "Can Conversational AI Counsel for Change? A Theory-Driven Approach to Supporting Dietary Intentions in Ambivalent Individuals"
Авторы: Michelle Bak, Kexin Quan, Tre Tomaszewski, Jessie Chin — School of Information Sciences, University of Illinois
Ключевые отсылки:
- Transtheoretical Model (TTM) — Prochaska & DiClemente
- Motivational Interviewing (MI) — Miller & Rollnick
- OARS техники — Open questions, Affirmations, Reflections, Summaries
