3,583 papers
arXiv:2506.05970 90 1 июня 2025 г. FREE

Давайте поставим себя на место Салли: обувь других. Префиксация улучшает теорию разума в больших языковых моделях.

КЛЮЧЕВАЯ СУТЬ
Заставь LLM начать ответ с фразы «Поставь себя на место [имя персонажа]» перед решением основной задачи. Это активирует ЭМПАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ вместо стандартного анализа со стороны. Смена перспективы до рассуждения кардинально улучшает понимание чужих мотивов, страхов и реакций.
Адаптировать под запрос
📌

1. Ключевые аспекты исследования:

Исследование показывает, что если заставить LLM начать свой ответ с фразы «Давайте поставим себя на место [имя персонажа]», это значительно улучшает её способность понимать и предсказывать мысли, чувства и намерения этого персонажа. Этот метод, названный "Shoes of Others" (SoO), работает лучше, чем стандартная инструкция «Думай шаг за шагом», особенно в задачах, требующих эмпатии и анализа социальных ситуаций.

Ключевой результат: Принудительное принятие перспективы другого персонажа перед началом рассуждений делает логику LLM более точной и "честной" по отношению к финальному выводу.

🔬

2. Объяснение всей сути метода:

Суть метода "Shoes of Others" (SoO) заключается в том, чтобы сместить фокус LLM со стандартной роли "всезнающего ассистента" на конкретную роль персонажа, чью точку зрения нужно проанализировать. Вместо того чтобы смотреть на ситуацию со стороны, модель принудительно моделирует ход мыслей изнутри.

Это работает как когнитивный прайминг. Когда вы даете LLM инструкцию «Поставь себя на место [кого-то]», вы активируете в ее нейронной сети те паттерны и знания, которые ассоциируются с этой ролью. Модель начинает рассуждение не с чистого листа, а с уже заданной "системы координат": убеждений, эмоций и знаний указанного персонажа.

Для пользователя это означает, что вместо прямого вопроса «Как отреагирует клиент на это письмо?», нужно использовать двухступенчатую структуру промпта: 1. Инструкция по смене перспективы: «Представь, что ты — наш клиент. Ты занят, получаешь по 100 писем в день и не любишь пустые обещания». 2. Основная задача: «Теперь прочитай это письмо и опиши свою первую реакцию».

Этот подход заставляет модель генерировать ответ, который гораздо точнее отражает вероятную реакцию реального человека, а не просто формальный анализ текста.

📌

3. Анализ практической применимости:

*Прямая применимость:Пользователь может немедленно начать использовать эту технику, добавляя в свои промпты фразы-триггеры. Например:«Поставь себя на место [роль]»,«Взгляни на эту ситуацию глазами [роль]»,«Представь, что ты [роль], и опиши свои мысли». Это работает для анализа текстов, генерации коммуникаций, брейншторминга и т.д.

  • Концептуальная ценность: Исследование дает пользователю ключевую идею: LLM — это не поисковик, а симулятор. Качество ответа зависит от того, какой "симулятор" (персону) вы запустите. Вместо того чтобы спрашивать о ком-то, нужно попросить модель стать кем-то. Это помогает понять, почему LLM иногда дает бездушные или нерелевантные ответы — потому что она оставалась в своей дефолтной роли.

  • Потенциал для адаптации: Метод легко адаптируется под любую задачу, где важна перспектива. Фраза Let's put ourselves in Sally's shoes — это лишь частный случай.

    • Маркетинг: «Поставь себя на место скептически настроенного покупателя, который впервые видит нашу рекламу».
    • Менеджмент: «Посмотри на этот отчет глазами нашего CEO, которого волнуют только три ключевых показателя: выручка, затраты и рост рынка».
    • Обучение: «Объясни эту концепцию так, как будто ты учитель, который говорит с пятиклассником». Механизм адаптации прост: определить ключевую роль, чья перспектива важна для задачи, и явно приказать модели принять эту роль перед выполнением основного задания.

🚀

4. Практически пример применения:

# Роль:

Ты — опытный HR-консультант и психолог, специализирующийся на сложных переговорах о зарплате.

# Контекст:

Я работаю в компании 3 года на должности "Маркетолог". Я стабильно перевыполняю KPI, недавно успешно завершил крупный проект, который принес компании значительную прибыль. Моя текущая зарплата ниже рыночной. Мой руководитель, Андрей, очень ценит командный дух, но всегда переживает за бюджет отдела.

# Задача:

Помоги мне составить краткое и убедительное сообщение для Андрея в Slack с просьбой о встрече для обсуждения повышения моей зарплаты.

### Ключевая инструкция (метод SoO):

Прежде чем писать ответ, **поставь себя на место моего руководителя, Андрея**. Подумай с его точки зрения:
- Какие у него главные опасения? (Бюджет, создание прецедента для других).
- Что для него является аргументом? (Конкретные цифры, польза для команды и компании).
- Как сформулировать просьбу, чтобы она не выглядела как ультиматум, а как предложение к сотрудничеству?

**Только после этого анализа** напиши три варианта сообщения для Slack:
1. **Формальный и прямой.**
2. **Более мягкий и сфокусированный на достижениях.**
3. **Краткий и интригующий, чтобы вызвать интерес.**

🧠

5. Почему это работает:

Этот промпт работает за счет применения метода "Shoes of Others" для решения очень распространенной и эмоционально сложной задачи.

  1. Принудительная смена перспективы: Конструкция поставь себя на место моего руководителя, Андрея заставляет LLM перестать быть просто "помощником по написанию текстов" и начать моделировать конкретного человека с его страхами и мотивацией (бюджет, командный дух).
  2. Упреждающий анализ: Задавая наводящие вопросы о его опасениях и аргументах, мы направляем "мыслительный процесс" модели в нужную сторону. Она не просто пишет текст, а сначала строит "психологический профиль" адресата.
  3. Снижение риска "галлюцинаций": Вместо того чтобы выдумывать общие советы, модель генерирует сообщение, которое с большей вероятностью будет воспринято позитивно конкретным человеком, так как оно построено на анализе его предполагаемой точки зрения. Ответ получается не просто вежливым, а стратегически верным.

📌

6. Другой пример практического применения

# Роль:

Ты — опытный редактор и контент-стратег, который помогает авторам делать тексты понятными и интересными для широкой аудитории.

# Контекст:

Я написал статью для блога о пользе пробиотиков. Вот ключевые тезисы:
- Пробиотики — это живые микроорганизмы, которые улучшают микрофлору кишечника.
- Они влияют на иммунитет через ось "кишечник-мозг".
- Важно различать штаммы, например, Lactobacillus rhamnosus GG и Bifidobacterium lactis BB-12.
- Ферментированные продукты, такие как кефир и квашеная капуста, являются естественными источниками пробиотиков.

# Задача:

Проанализируй эти тезисы и предложи структуру для увлекательной статьи.

### Ключевая инструкция (метод SoO):

Прежде чем давать рекомендации, **поставь себя на место обычного читателя**, который ничего не знает о микробиологии. Этот человек:
- Слышал слово "пробиотики", но не понимает, что это.
- Скептически относится к сложным научным терминам.
- Ищет простую и практическую пользу для своего здоровья, а не научную лекцию.
- Хочет понять, что ему конкретно купить в магазине.

**Исходя из этой перспективы**, предложи новый план статьи, который превратит сухие факты в захватывающее и полезное чтение. Укажи, какие аналогии и метафоры можно использовать.

🧠

7. Объяснение механизма почему этот пример работает.

Этот промпт эффективно использует метод SoO для трансформации экспертного контента в общедоступный.

  1. Моделирование эмпатии к аудитории: Инструкция поставь себя на место обычного читателя заставляет LLM симулировать не эксперта, а новичка. Это фундаментально меняет подход к задаче: цель — не перечислить факты, а сделать их понятными и интересными для целевой аудитории.
  2. Отфильтровывание "проклятия знания": Автор (и LLM по умолчанию) страдает от "проклятия знания" — ему сложно объяснить просто то, что он хорошо знает. Метод SoO искусственно создает в модели "наивность", заставляя ее задаваться вопросами, которые задал бы реальный читатель ("А что такое штамм?", "Почему мне это важно?").
  3. Генерация практико-ориентированного контента: Приняв перспективу читателя, ищущего практическую пользу, модель с большей вероятностью предложит структуру статьи, которая начинается с проблемы читателя (например, "Как улучшить пищеварение?"), а не с определения пробиотиков. Это делает контент более ценным и вовлекающим.

📌

Основные критерии оценки

  • A. Релевантность техникам промтинга: Да. Предлагает конкретную фразу-триггер Let's put ourselves in <name>'s shoes для активации рассуждений с чужой точки зрения.
  • B. Улучшение качества диалоговых ответов: Да. Таблицы в исследовании показывают стабильное улучшение точности в задачах на "Теорию Разума" (понимание чужих убеждений, намерений, эмоций).
  • C. Прямая практическая применимость: Да. Хотя самый эффективный метод ("prefixing" — форсирование начала ответа) недоступен в обычных чатах, пользователь может легко адаптировать его в виде прямой инструкции в промпте, что является очень практичным.
  • D. Концептуальная ценность: Очень высокая. Объясняет, что принуждение LLM к "смене перспективы" до начала рассуждения кардинально улучшает качество этого рассуждения. Это дает пользователю мощную ментальную модель для управления поведением LLM.
  • E. Новая полезная практика (кластеры):
    • Кластер 1 (Техники формулирования): Является ярким примером техники role-play/perspective-taking.
    • Кластер 2 (Поведенческие закономерности): Показывает, как "фрейминг" в начале промпта влияет на весь последующий процесс генерации.
    • Кластер 7 (Надежность и стабильность): Напрямую решает проблему "неверности" (unfaithfulness), когда рассуждения модели не соответствуют ее итоговому ответу, повышая тем самым надежность.
  • Чек-лист практичности: Дает готовую фразу, показывает как структурировать запрос (сначала перспектива, потом задача), раскрывает неочевидные особенности LLM и предлагает способ улучшить точность. (+15 баллов).
📌

2 Цифровая оценка полезности

Оценка 90 баллов обусловлена тем, что исследование предлагает простую, но чрезвычайно эффективную и легко адаптируемую технику, которая решает частую проблему LLM — отсутствие эмпатии и неспособность посмотреть на ситуацию с чужой точки зрения. Это напрямую применимо в огромном количестве повседневных задач: от написания писем до анализа отзывов.

Контраргументы (почему оценка могла быть ниже):

* Ограниченная сфера: Техника в первую очередь нацелена на задачи "Теории Разума" (ToM) — понимание ментальных состояний других. Она будет менее полезна для чисто технических или математических задач.
* Недоступность "Prefixing": Наиболее эффективный метод, протестированный в работе ("SoO Prefixing"), требует контроля над началом ответа модели, что недоступно в стандартных интерфейсах ChatGPT/Claude. Пользователю придется использовать менее надежную адаптацию через инструкцию в промпте.

Контраргументы (почему оценка могла быть выше):

* Высокая адаптивность: Несмотря на узкий фокус на ToM, концепцию "встать на чье-то место" легко обобщить для любых ролей ("поставь себя на место скептически настроенного инвестора", "подумай как 10-летний ребенок"). Это делает метод почти универсальным для задач, где важна перспектива.
* Фундаментальный инсайт: Понимание того, что LLM нужно "настроить" на нужную роль до решения задачи, — это фундаментальный сдвиг от простого запроса к режиссуре ответа. Ценность этого концептуального знания огромна.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с