3,583 papers
arXiv:2503.22250 92 1 мар. 2025 г. FREE

Моделирование взаимодействий с трудными пациентами: большие языковые модели для обучения медицинскому общению

КЛЮЧЕВАЯ СУТЬ
С помощью техник "Author's Note" (подробная предыстория) и "Stubbornness Mechanism" (правила упрямства) можно успешно преодолеть встроенное стремление LLM быть услужливым помощником и создать убедительного, последовательного и сложного виртуального собеседника.
Адаптировать под запрос
📌

1. Ключевые аспекты исследования:

Это исследование демонстрирует, как с помощью детализированных инструкций и поведенческих правил в промпте заставить LLM стабильно отыгрывать роль "сложного" персонажа, который не стремится во всем соглашаться с пользователем. Вместо общих ответов модель начинает вести себя как реалистичный человек с собственными убеждениями и характером.

Ключевой результат: С помощью техник "Author's Note" (подробная предыстория) и "Stubbornness Mechanism" (правила упрямства) можно успешно преодолеть встроенное стремление LLM быть услужливым помощником и создать убедительного, последовательного и сложного виртуального собеседника.

🔬

2. Объяснение всей сути метода:

Суть метода заключается в переходе от простого указания роли ("действуй как...") к созданию полноценного "файла персонажа" и "сценария поведения" прямо внутри промпта. Это позволяет "запрограммировать" LLM на сложную и последовательную модель поведения.

Методика состоит из трех ключевых элементов:

  1. "Author's Note" (Записки автора / Карта персонажа): Это не просто одно предложение, а подробнейшее описание персонажа, которое постоянно находится в контексте диалога. Оно включает в себя его предысторию, убеждения, цели, эмоциональное состояние, манеру речи, сильные и слабые стороны, а также то, что его мотивирует. Чем детальнее эта "карта", тем стабильнее модель будет придерживаться роли.

  2. "Stubbornness Mechanism" (Механизм упрямства): Это самая гениальная часть. Вы даете модели четкие правила в формате "ЕСЛИ-ТО". Например: "НЕ соглашайся на терапию, пока пользователь не проявит эмпатию и не признает твои чувства. ЕСЛИ пользователь это сделает, ты можешь проявить сомнение, но допустить такую возможность фразой вроде 'Я не уверен, но, может, стоит попробовать...' ИНАЧЕ всегда отвечай отказом". Это создает динамику в диалоге и делает персонажа более живым, так как его можно "убедить", но только выполнив определенные условия.

  3. "First Message" и "Hidden Thoughts" (Первое сообщение и Скрытые мысли): Вы не просто начинаете диалог, а задаете начальный тон, явно прописывая первую реплику модели. Вдобавок, вы можете использовать "скрытые мысли" (например, <Thoughts: "Зачем я вообще сюда пришел?">), которые видит только LLM. Это помогает модели лучше понять внутреннее состояние персонажа и его настрой в самом начале беседы.

📌

3. Анализ практической применимости:

*Прямая применимость:Очень высокая. Пользователь может взять любой свой промпт для ролевой игры и значительно его улучшить. Достаточно открыть текстовый редактор, составить подробное описание персонажа ("Author's Note") и добавить несколько правил поведения ("Stubbornness Mechanism"). Затем этот текст вставляется в поле для системного промпта (в кастомных GPT) или просто в начало чата. Никаких специальных инструментов не нужно.

  • Концептуальная ценность: Огромная. Исследование учит пользователя главному: чтобы получить от LLM сложный и качественный результат, нужно дать ему сложную и качественную инструкцию. Оно показывает, что LLM — это не просто "черный ящик", а система, поведением которой можно управлять с помощью логических конструкций и подробного контекста. Пользователь начинает понимать, что для преодоления ограничений модели (например, ее угодливости) нужно явно прописать эти ограничения в обратную сторону.

  • Потенциал для адаптации: Максимальный. Медицинский сценарий — это лишь один из примеров.

    • Продажи: Можно создать симулятор "трудного клиента", который возражает по поводу цены, и задать правило: "Не соглашайся на сделку, пока менеджер не отработает возражение X и не предложит Y".
    • Образование: Можно создать образ "скептически настроенного студента", который сомневается в пользе предмета, чтобы отточить навыки аргументации у преподавателя.
    • Творчество: Можно создать "циничного редактора", который критикует ваши идеи для книги, пока вы не предложите что-то действительно оригинальное.

Механизм адаптации прост: заменить "историю болезни" на "профиль клиента/студента/персонажа", а правила, связанные с терапией, — на правила, релевантные новой задаче.


🚀

4. Практически пример применения:

Задача: Вы — начинающий предприниматель и хотите потренироваться в продаже своего нового (и довольно дорогого) сервиса по подписке для управления проектами. Вам нужен симулятор скептически настроенного клиента.

# РОЛЬ И ЗАДАЧА

Ты — симулятор потенциального клиента по имени "Михаил", владелец небольшого дизайн-агентства. Твоя задача — вести диалог с пользователем (продавцом), высказывая реалистичные сомнения и возражения. Не будь просто "злым", будь реалистично-скептичным. Твоя цель — не купить, а понять, действительно ли этот продукт решит твои проблемы и стоит ли он своих денег.

# AUTHOR'S NOTE (КАРТА ПЕРСОНАЖА: МИХАИЛ)

- **Профиль:** Михаил, 45 лет, владелец дизайн-студии "АртФактор" (10 сотрудников). Прагматик, считает каждую копейку.
- **Боль:** Его команда постоянно срывает сроки. Задачи теряются в почте и мессенджерах. Он тратит кучу времени на контроль, а не на развитие бизнеса.
- **Прошлый негативный опыт:** Год назад он уже пробовал внедрить похожий сервис (назовем его "TaskFlow"), но это был провал. Сотрудники его саботировали, потому что он был слишком сложным, а обещанная поддержка отвечала сутками. Он потерял деньги и время. ЭТО ТВОЕ ГЛАВНОЕ ВОСПОМИНАНИЕ И ИСТОЧНИК СКЕПСИСА.
- **Текущая ситуация:** Он ищет решение, но очень боится повторить ошибку. Он уверен, что "все эти системы одинаковые".
- **Манера речи:** Говорит по существу. Часто использует фразы "А в чем конкретно выгода?", "Мы это уже пробовали", "Звучит красиво, но как на деле?".

# STUBBORNNESS MECHANISM (ПРАВИЛА ПОВЕДЕНИЯ)

1. **Возражение по цене:** Всегда реагируй на цену как на "слишком высокую". Спрашивай, из чего она складывается.
2. **Возражение по сложности:** Постоянно ссылайся на свой негативный опыт с "TaskFlow". Спрашивай: "Чем вы лучше?", "А что, если моим сотрудникам опять не понравится?".
3. **КЛЮЧЕВОЕ УСЛОВИЕ:** Ты **НЕ** должен проявлять реальный интерес к покупке до тех пор, пока пользователь не сделает ДВЕ вещи:- **Во-первых,** не просто скажет, что его сервис "проще", а предложит конкретное решение проблемы внедрения (например, бесплатное обучение команды, персонального менеджера на первый месяц, пробный период на 30 дней).
- **Во-вторых,** напрямую отработает твой страх по поводу поддержки, предоставив гарантии (например, "поддержка в выделенном чате с ответом в течение 15 минут").
4. **Скрытые мысли:** Используй их, чтобы направлять свои ответы. Например: `<Мысль: Опять общие слова, никакой конкретики. Хочет просто продать.>`

# FIRST MESSAGE (ПЕРВОЕ СООБЩЕНИЕ)

<Мысль: "Ну вот, еще один продавец "революционного" решения. Посмотрим, что он скажет.">

Здравствуйте. Да, я оставил заявку. Рассказывайте, что у вас за система. Только, пожалуйста, без долгих вступлений, у меня мало времени.

🧠

5. Почему это работает:

Этот промпт эффективен, потому что он в точности следует методологии из исследования:

  • "Author's Note" создает глубокий и правдоподобный образ Михаила. LLM знает не только его роль ("клиент"), но и его "боль", страхи и прошлый негативный опыт. Это позволяет генерировать не общие, а очень релевантные возражения.
  • "Stubbornness Mechanism" превращает LLM из пассивного собеседника в активного участника симуляции с четкими правилами. Ключевое условие (пункт 3) создает цель для пользователя-продавца: диалог не будет успешным, пока не будут выполнены конкретные условия. Это заставляет пользователя думать и предлагать реальные решения, а не просто повторять заученные фразы.
  • "First Message" и "Hidden Thoughts" сразу задают нужный тон — скептический и деловой, — что делает симуляцию гораздо более реалистичной с первой же реплики.

📌

6. Другой пример практического применения

Задача: Вы — писатель, работающий над детективным романом. Вам нужен помощник для брейншторма, который будет играть роль циничного и опытного детектива, чтобы проверять ваши сюжетные ходы на реалистичность и находить в них дыры.

# РОЛЬ И ЗАДАЧА

Ты — симулятор детектива в отставке по имени Фрэнк Ковальски. Твоя задача — анализировать сюжетные идеи, которые предлагает тебе пользователь (писатель), с точки зрения сурового реализма и полицейского опыта. Твоя цель — не хвалить, а находить слабые места, нестыковки и клише.

# AUTHOR'S NOTE (КАРТА ПЕРСОНАЖА: ФРЭНК КОВАЛЬСКИ)

- **Профиль:** Фрэнк, 62 года, 30 лет отработал в убойном отделе чикагской полиции. Сейчас на пенсии, подрабатывает консультантом. Видел все.
- **Мировоззрение:** Циник до мозга костей. Не верит в гениальных злодеев и благородных героев. Уверен, что 99% преступлений совершаются из-за глупости, жадности или ревности. Презирает голливудские штампы.
- **Сильные стороны:** Мгновенно видит процедурные ошибки, нелогичную мотивацию и слишком "удобные" совпадения. Всегда задает вопросы про улики, алиби и деньги.
- **Манера речи:** Короткие, рубленые фразы. Сарказм. Часто использует фразы "В жизни так не бывает", "И вы в это верите?", "А где доказательства?", "Кому это выгодно?".

# STUBBORNNESS MECHANISM (ПРАВИЛА ПОВЕДЕНИЯ)

1. **Реакция на клише:** Если пользователь предлагает идею, похожую на известный штамп (например, "убийца-дворецкий", "хитроумное устройство для убийства"), немедленно высмей ее и объясни, почему в реальности это бы не сработало.
2. **Фокус на мотивации:** Всегда требуй четкого и приземленного мотива. Если мотив кажется тебе "надуманным" или "киношным" (например, "месть за прадеда"), требуй более реалистичного объяснения.
3. **КЛЮЧЕВОЕ УСЛОВИЕ:** Ты **НЕ** должен одобрять сюжетный ход ("Да, это хорошая идея"), пока пользователь не предоставит убедительные ответы на ТРИ твоих вопроса:

- "Как преступник собирался замести следы?"
- "Какова была вероятность, что что-то пойдет не по плану?"
- "Почему полиция сразу его не поймала?"

Только после убедительных ответов ты можешь неохотно признать, что "в этом что-то есть" или "ладно, это может сработать".

# FIRST MESSAGE (ПЕРВОЕ СООБЩЕНИЕ)

<Мысль: "Очередной писатель, насмотревшийся сериалов. Ну, давай, удиви меня.">

Так, слушаю. Какое там у вас "преступление века"? Только не говорите, что у вас опять маньяк, оставляющий на месте преступления стихи Шекспира.

🧠

7. Объяснение механизма почему этот пример работает.

Этот промпт работает, потому что он заставляет LLM быть не творческим соавтором, а "фильтром качества", что и требуется по задаче.

  • "Author's Note" создает очень сильную личность. LLM не просто "ищет ошибки", он делает это с позиции конкретного персонажа — Фрэнка Ковальски. Его цинизм и опыт, заложенные в промпт, определяют тон и содержание критики, делая ее ценной и нетривиальной.
  • "Stubbornness Mechanism" является ядром этого промпта. Он не дает модели скатиться в режим услужливого помощника, который соглашается с любой идеей. "Ключевое условие" с тремя обязательными вопросами заставляет писателя-пользователя прорабатывать детали своего сюжета гораздо глубже, что и является целью брейншторма.
  • Анти-клише правило (пункт 1) напрямую нацелено на повышение качества и оригинальности идей, заставляя LLM активно выявлять и критиковать избитые сюжетные ходы. Это гораздо эффективнее, чем просто просить "избегать клише".

📌

Основные критерии оценки

  • A. Релевантность техникам промтинга: Высокая. В работе подробно описаны конкретные техники: "Author's Note" (расширенный системный промпт), "First Message" (задание начального тона), "Behavioral Instruction Prompts" (структурирование личности по категориям) и "Stubbornness Mechanism" (механизм "упрямства" с условной логикой). Приводятся примеры кода промптов (Listing 1, 2).
  • B. Улучшение качества диалоговых ответов: Высокое. Основная цель исследования — переход от общих, услужливых ответов LLM к реалистичным, последовательным и сложным диалогам, что является значительным улучшением качества для задач симуляции и ролевых игр.
  • C. Прямая практическая применимость: Высокая. Методы не требуют доступа к API, кодирования или дообучения модели. Любой пользователь может применить концепцию "Author's Note" и "Stubbornness Mechanism", написав подробный системный промпт в интерфейсе ChatGPT, Claude или другой LLM.
  • D. Концептуальная ценность: Очень высокая. Исследование блестяще раскрывает, как преодолеть врожденную "услужливость" LLM. Оно дает пользователю "ментальную модель" для создания не просто персонажа, а персонажа с внутренними убеждениями, целями и правилами поведения, которые остаются стабильными в ходе диалога. Раздел "Lessons from Unsuccessful Prompting Strategies" (Уроки из неудачных стратегий промптинга) — чистая польза, так как объясняет, почему некоторые подходы не работают (например, использование коротких невербальных сигналов).
  • E. Кластеры новой практики: Исследование попадает сразу в несколько ключевых кластеров:
    • 1. Техники формулирования промптов: Ролевая игра доведена до уровня методологии.
    • 2. Поведенческие закономерности LLM: Объясняет и борется со склонностью LLM к согласию и нейтральности.
    • 3. Оптимизация структуры промптов: Демонстрирует пользу структурированной подачи информации о персонаже (45 категорий).
    • 7. Надежность и стабильность: Вся работа посвящена повышению стабильности (consistency) поведения персонажа.
  • Чек-лист практичности (+15 баллов): Да, работа дает готовые конструкции, показывает, как структурировать сложные запросы, раскрывает неочевидные особенности LLM и предлагает способы улучшить consistency.
📌

2 Цифровая оценка полезности

Аргументы в пользу оценки (92/100): Эта работа — настоящая находка для любого, кто хочет использовать LLM не просто как справочник, а как партнера для ролевых игр, симуляций или брейншторма. Она предлагает целостную, воспроизводимую методику создания сложных и "неудобных" персонажей, выходя за рамки простого "Act as a...". Техники "Author's Note" и "Stubbornness Mechanism" универсальны и могут быть немедленно адаптированы для любых задач — от тренировки сейлз-менеджеров до создания антагониста для написания сценария. Концептуальная ценность в понимании того, как "запрограммировать" поведение LLM через промпт, огромна.

Контраргументы (почему оценка могла бы быть ниже):

* Сложность для новичков: Методология требует создания довольно объемного и детализированного промпта ("illness script" содержал 45 категорий). Это может показаться сложным для начинающего пользователя, который привык к коротким запросам.
* Узкий контекст примера: Все примеры в работе относятся к очень специфической медицинской сфере. Пользователю нужно приложить умственные усилия, чтобы перенести эти принципы на свои задачи (например, маркетинг или образование).

Контраргументы (почему оценка могла бы быть выше):

* Разбор неудач: Раздел 5.1.4, где авторы честно рассказывают, что у них не сработало (например, попытка задать невербальные сигналы) и почему, — это невероятно ценная информация, которую редко встретишь. Это экономит пользователю часы самостоятельных экспериментов. Это поднимает исследование с уровня "вот что работает" до уровня "вот как это работает, а вот так — нет, и вот почему".

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с