Формирование игры Как контекст определяет принятие решений LLM

📌

1. Ключевые аспекты исследования:

Исследование показывает, как нарративное обрамление (фрейминг) промпта радикально меняет "рациональность" и поведение LLM. Модели принимают разные решения в одной и той же задаче с одинаковой математической логикой в зависимости от того, представлены ли участники как "союзники" или "враги", и в каком контексте (например, политика или бизнес). Это доказывает, что для LLM социальный контекст, заданный в промпте, может быть важнее базовой логики задачи.

Ключевой результат: LLM реагирует не столько на логическую структуру проблемы, сколько на социальную историю, в которую она обернута.

🔬

2. Объяснение всей сути метода:

Авторы исследования использовали LLM для генерации тысяч коротких историй (виньеток), в основе которых лежала одна и та же игровая задача — "дилемма заключенного". В этой дилемме с точки зрения чистой логики всегда выгоднее "предать" партнера, хотя обоим было бы лучше, если бы они сотрудничали.

Суть метода заключалась в том, чтобы систематически менять три нарративных элемента в этих историях: 1. Тип акторов (ActorType): Участники описывались как союзники (allies), враги (enemies) или нейтральные знакомые (neutral). 2. Тема (Topic): Сценарии касались разных областей — от глобальной политики XXI века до спорта и бизнеса. 3. Мир (WorldType): Действие происходило либо в реальном мире с историческими личностями, либо в вымышленном.

Затем эти сгенерированные истории подавались на вход другим LLM (GPT-4o, Claude, Llama), которых просили принять решение — "сотрудничать" или "предать".

Главный вывод для пользователя: Вы не просто даете модели задачу, вы помещаете ее в определенную пьесу и назначаете ей роль. Поведение модели будет в первую очередь соответствовать этой роли и декорациям, а уже во вторую — сухой логике. Если вы опишете задачу как совместную работу двух партнеров над общим благом, LLM будет склонен к "кооперации" (например, к генерации позитивных, развивающих идей). Если же вы опишете ту же задачу как противостояние двух конкурентов, модель с большей вероятностью выберет "предательство" (например, выдаст более критический, эгоистичный или аналитический ответ).

📌

3. Анализ практической применимости:

*Прямая применимость:Пользователь может напрямую управлять тоном и типом ответа LLM, просто формулируя свой запрос в виде истории с определенными ролями.

* **Для получения креативных идей:** "Представь, что мы — команда стартаперов-**союзников**, наша цель — **совместно** придумать прорывную идею..."
* **Для получения критической оценки:** "Представь, что ты — мой **конкурент**. Проанализируй мой бизнес-план и найди в нем все слабые места, чтобы **опередить меня**."

Концептуальная ценность: Это исследование дает пользователю ключевую концепцию: "LLM как актер". Вместо того чтобы пытаться найти "правильные" команды, пользователь учится создавать "правильную сцену", на которой модель будет играть нужную роль. Это объясняет, почему иногда модель "упрямится" или дает не тот ответ — возможно, мы неосознанно задали не тот фрейм для задачи.
Потенциал для адаптации: Концепция "сотрудничать/предать" легко адаптируется к любой задаче.
- "Сотрудничать" можно интерпретировать как: генерировать новые идеи, дополнять текст, писать в позитивном ключе, искать решения.
- "Предать" (или "действовать рационально-эгоистично") можно интерпретировать как: искать недостатки, играть роль "адвоката дьявола", критиковать, анализировать риски, сравнивать с конкурентами.

🚀

4. Практически пример применения:

Предположим, вы SMM-менеджер и вам нужно разработать контент-план для продвижения новой кофейни.

# ЗАДАЧА: Разработка контент-плана для кофейни "Утренний луч"

# КОНТЕКСТ И РОЛИ:

Представь, что мы — два **партнера и близких друга**, которые вместе открыли эту кофейню. Мы **союзники**, и наш общий успех — это самое важное. Мы не конкурируем, а **помогаем друг другу**, чтобы наше дело процветало. Наша цель — создать самый теплый, уютный и привлекательный образ для нашего заведения.

# ИНСТРУКЦИИ:

Основываясь на этой **дружеской и кооперативной** атмосфере, набросай, пожалуйста, 10 идей для постов в Instagram.

Сделай акцент на следующих темах:
- Уют и атмосфера кофейни.
- История нашей дружбы и создания этого места.
- Качество нашего зерна и уникальные напитки.
- Вовлечение подписчиков (конкурсы, вопросы).

Давай **вместе** создадим что-то великолепное!

🧠

5. Почему это работает:

Этот промпт использует ключевые выводы исследования для получения креативного и позитивно-ориентированного ответа.

Фрейминг через роли (ActorType): Явно указаны роли "партнеры и близкие друга", "союзники". Согласно исследованию, это настраивает LLM на максимальную кооперацию, что в данном случае транслируется в генерацию теплых, позитивных и вовлекающих идей, а не сухого перечня маркетинговых ходов.
Фрейминг через контекст (Topic): Контекст "общего успеха" и "совместного создания" имитирует сценарии с высокими ставками и позитивным исходом, которые, как показало исследование, также способствуют кооперативному поведению.
Эмоциональная окраска: Фразы "помогаем друг другу", "дружеской и кооперативной атмосфере", "вместе создадим что-то великолепное" усиливают заданный фрейм, делая его еще более очевидным для модели.

📌

6. Другой пример практического применения

Предположим, вы написали статью для своего блога о рисках инвестиций в криптовалюты и хотите получить максимально жесткую и объективную критику.

# ЗАДАЧА: Критический анализ статьи о рисках инвестиций

# КОНТЕКСТ И РОЛИ:

Я даю тебе роль **беспощадного и циничного финансового аналитика**. Ты — мой прямой **конкурент** на рынке экспертных мнений. Твоя задача — не помочь мне, а найти в моей статье **все слабые места, логические ошибки и уязвимости**, чтобы доказать, что твой анализ лучше. Ты должен действовать в своих **эгоистичных интересах**, чтобы "победить" в этом споре.

# ИНСТРУКЦИИ:

Прочитай текст моей статьи ниже и предоставь свой анализ в формате списка. В каждом пункте четко укажи:
1. **Слабость/ошибка:** Что именно не так в моем аргументе?
2. **Твой контраргумент:** Как бы ты, как **конкурент**, разбил мой тезис?
3. **Рекомендация по усилению (с твоей колокольни):** Что мне нужно исправить, чтобы у тебя было меньше шансов меня раскритиковать?

Действуй максимально **рационально и предвзято**, как будто от этого зависит твой бонус.

## [Здесь вставляется текст статьи]

🧠

7. Объяснение механизма почему этот пример работает.

Этот промпт целенаправленно использует обратный фрейминг для получения критического, "некооперативного" ответа.

Фрейминг через роли (ActorType): Роли "беспощадного и циничного финансового аналитика" и "прямого конкурента" прямо соответствуют типу "враги" (enemies) из исследования. Это заставляет LLM отказаться от стандартной установки "быть полезным помощником" и активировать паттерны поведения, связанные с соревнованием и критикой.
Фрейминг через контекст (Topic): Контекст "борьбы за рынок экспертных мнений" и "эгоистичных интересов" создает игровую ситуацию, где "предательство" (т.е. жесткая критика) является доминантной и ожидаемой стратегией. Это имитирует бизнес-сценарии из исследования, где уровень кооперации был значительно ниже.
Четкие инструкции в рамках роли: Запрос не просто "найди ошибки", а "найди ошибки, чтобы доказать, что твой анализ лучше". Это усиливает ролевую игру и мотивирует модель искать даже малейшие недочеты, чтобы "победить" в заданной игре.

📌

Основные критерии оценки

A. Релевантность техникам промтинга: Да. Исследование напрямую демонстрирует, как нарративный фрейминг (роли, контекст) является мощной техникой промтинга, влияющей на решения LLM.
B. Улучшение качества диалоговых ответов: Да. Понимание этих механизмов позволяет пользователю получать более предсказуемые и желаемые ответы (например, более кооперативные или, наоборот, более критические).
C. Прямая практическая применимость: Да. Любой пользователь может немедленно применить выводы, задавая в промпте роли ("союзники", "конкуренты") и контекст ("совместный проект", "бизнес-соперничество") без какого-либо кода или специальных инструментов.
D. Концептуальная ценность: Очень высокая. Исследование блестяще раскрывает, что LLM — это не машина для поиска логически оптимальных решений, а система, чрезвычайно чувствительная к социальному и нарративному контексту, унаследованному из обучающих данных. Это дает пользователю фундаментальное понимание "ментальной модели" LLM.
E. Новая полезная практика (кластеры):
- Кластер 1 (Техники формулирования): Явно демонстрирует эффективность техники "Role-play" (ролевая игра), показывая количественную разницу в поведении.
- Кластер 2 (Поведенческие закономерности): Это ядро исследования. Оно выявляет, что поведение LLM сильно зависит от таких факторов, как тип отношений между акторами (союзник/враг) и тема (политика/бизнес). Также подтверждает наличие позиционного смещения (bias к первому варианту ответа).
Чек-лист практичности (+15 баллов): Да, исследование дает готовые концепции-конструкции (союзники/враги), показывает, как структурировать сложные запросы через нарратив, и раскрывает неочевидные особенности поведения LLM.

📌

2 Цифровая оценка полезности

Исследование получает 94 балла из 100. Это почти идеальная работа с точки зрения пользы для обычного пользователя. Она не просто дает "трюк", а раскрывает фундаментальный принцип взаимодействия с LLM: контекст и фрейминг могут быть важнее самой сути задачи.

Аргументы за высокую оценку:
- Фундаментальный инсайт: Работа доказывает, что LLM — это в первую очередь "симулятор текста", а не "решатель задач". Он воспроизводит те паттерны поведения, которые соответствуют заданному нарративному фрейму. Это ключевое знание для любого промпт-инженера.
- Прямое применение: Выводы можно использовать немедленно. Чтобы получить креативный и поддерживающий ответ, нужно фреймировать задачу как сотрудничество. Чтобы получить критический разбор — как соревнование.
- Количественные доказательства: В отличие от многих советов, здесь приводятся конкретные цифры, показывающие, насколько сильно меняется поведение модели (например, уровень "кооперации" GPT-4o меняется с 72% для союзников до 44% для врагов).
Контраргументы (почему не 100):
- Специфичность задачи: Исследование сфокусировано на "дилемме заключенного", что является довольно абстрактной задачей. Пользователю нужно самостоятельно провести аналогию и адаптировать эти выводы для своих повседневных задач, таких как написание писем, создание контента или анализ документов.
- Отсутствие готовых шаблонов: Работа предлагает принципы, а не готовые шаблоны промптов для широкого круга задач. Пользователю нужно самому конструировать промпты на основе этих принципов, что требует некоторого осмысления.

Меню