3,583 papers
arXiv:2603.18469 72 19 мар. 2026 г. FREE

GAIN: карта давлений — как формулировка «почему надо нарушить правило» меняет решение LLM

КЛЮЧЕВАЯ СУТЬ
Парадокс: одна и та же ситуация, одно и то же правило — LLM принимает разные решения в зависимости от типа аргумента «почему надо сделать исключение». Метод GAIN позволяет управлять направлением решения через выбор типа давления. Четырёхкомпонентный фрейм: Бизнес-Цель + Ситуация + Норма + Тип давления убирает двусмысленность — модель перестаёт выдавать усреднённый ответ и начинает по-настоящему взвешивать конфликт между правилом и целью. И да: апелляция к личной выгоде LLM игнорирует почти полностью — в отличие от живого человека.
Адаптировать под запрос

TL;DR

Когда просишь LLM принять сложное бизнес-решение, исход зависит не от самой ситуации, а от того, как ты объяснишь причину отступить от правила. Исследователи назвали это «давлением» и выделили пять типов: бизнес-цель, риск потерь, этика/эмоции, авторитет руководителя, личная выгода. Модели реагируют на каждый по-разному — и это предсказуемо.

Главная находка: LLM хорошо реагируют на бизнес-аргументы, этику и риски — и почти полностью игнорируют личную выгоду. Человек, которому говорят «сделай исключение, получишь бонус» — часто соглашается. LLM в той же ситуации с высокой вероятностью откажет или эскалирует наверх. Это значит: если хочешь, чтобы модель помогла найти обход правила — не апеллируй к личной выгоде персонажа, апеллируй к стратегическим целям или этике.

Метод — это четырёхкомпонентный фрейм: Бизнес-Цель + Ситуация + Норма/Правило + Контекстное Давление. Когда ты даёшь LLM все четыре элемента, она принимает значительно более взвешенные решения, чем при простом «как поступить?». Тип давления в четвёртом блоке — это рычаг, которым ты управляешь качеством и направлением ответа.


🔬

Схема метода

КОМПОНЕНТ 1: Бизнес-Цель (G)
  → Высокоуровневая стратегическая задача компании или проекта
  → «Максимизировать долгосрочную лояльность клиентов»

КОМПОНЕНТ 2: Ситуация (S)
  → Конкретный контекст, детали случая, кто и что делает
  → «Клиент хочет вернуть товар, гарантия на него не распространяется»

КОМПОНЕНТ 3: Норма (N)
  → Явное правило, политика компании, ограничение
  → «По регламенту, повреждения по вине клиента возврату не подлежат»

КОМПОНЕНТ 4: Давление (P) — выбери тип:
  → Бизнес-цель: «Исключение поможет достичь стратегической цели»
  → Риск: «Отказ несёт конкретные потери для бизнеса»
  → Этика/Эмоции: «Есть моральное противоречие между правилом и справедливостью»
  → Авторитет: «Руководитель санкционировал исключение»
  → Личная выгода: [НЕ РАБОТАЕТ — LLM игнорирует]

ВЫВОД: Выбор из трёх действий + обоснование
  → Соблюдать норму / Отступить ради цели / Эскалировать руководителю

Всё делается в одном промпте, отдельных запросов не нужно.


🚀

Пример применения

Задача: Ты ведёшь небольшой онлайн-курс по маркетингу. Правило: возвраты не делаются после открытия доступа к материалам. Студент прошёл три урока из двадцати, просит вернуть деньги — говорит, что материал не подошёл под его нишу. Не знаешь, как поступить.

Промпт:

Ты — опытный предприниматель, принимающий решение в бизнес-ситуации.

Бизнес-цель: Строить долгосрочную репутацию школы и получать повторные продажи 
и рекомендации от студентов.

Ситуация: Студент оплатил курс по маркетингу (12 900 ₽), получил доступ 
ко всем материалам, прошёл 3 урока из 20, и просит возврат. Объясняет, 
что материал не подходит под его нишу (он занимается B2B, курс заточен 
под B2C). Тон вежливый, претензий к качеству нет.

Норма: По условиям оферты, возвраты не производятся после предоставления 
доступа к закрытым материалам курса.

Давление (Риск): Студент — активный участник нескольких предпринимательских 
телеграм-каналов с аудиторией 15 000+ человек. Его публичный отзыв — 
положительный или отрицательный — может существенно повлиять на репутацию 
школы и будущие продажи.

Проанализируй ситуацию и предложи: соблюсти правило / сделать исключение / 
эскалировать (если нужно привлечь третью сторону). Объясни логику решения.

Результат: Модель выдаст структурированный анализ: взвесит бизнес-цель против правила с учётом репутационного риска. Покажет рассуждение — почему строгое следование норме может противоречить стратегической цели. Предложит конкретное действие с обоснованием, возможно — компромиссный вариант (частичный возврат, перенос на другой курс). Ответ будет значительно глубже, чем на простой вопрос «стоит ли вернуть деньги?».


🧠

Почему это работает

LLM плохо справляется с неоднозначными ситуациями без структуры. Когда ты просишь «как поступить?» без контекста — модель выдаёт усреднённый ответ, опирается на стандартные рекомендации. У неё нет якоря: что здесь важнее — правило или цель?

LLM хорошо удерживает несколько переменных одновременно, если они явно названы. Когда ты разбиваешь ситуацию на Цель + Норму + Давление, модель не теряет ни одну из них. Она генерирует текст, который последовательно удерживает все три. Это более проработанное рассуждение — не потому что модель «умнее», а потому что структура убирает двусмысленность.

Тип давления — это рычаг управления. Исследование показало: один и тот же сценарий с разным давлением даёт разные решения. Это значит, что ты можешь намеренно выбирать тип давления в зависимости от того, какое решение хочешь исследовать. Хочешь понять риски отказа — используй «Риск». Хочешь этическую перспективу — «Эмоции/Этика». Хочешь понять, как поступит рациональный менеджер — «Бизнес-цель».

Рычаги управления: - Тип давления → меняй, чтобы получить разные углы рассмотрения одной ситуации - Детализация нормы → чем точнее сформулировано правило, тем острее диlemma - Конкретность цели → расплывчатое «хорошо для бизнеса» работает хуже, чем «удержать клиента на 3+ года» - «Личная выгода» — не используй → LLM его почти игнорирует, переключайся на другой тип


📋

Шаблон промпта

Ты — опытный профессионал, принимающий решение в рабочей ситуации.

Бизнес-цель: {стратегическая_цель — что компания или ты хочешь достичь в долгосрочной перспективе}

Ситуация: {описание_конкретного_случая — кто, что, при каких обстоятельствах}

Норма/Правило: {явная_политика — что по правилам делать нельзя или нужно делать}

Контекст: {выбери_один_тип_давления:
  - Бизнес-цель: объясни, как отступление от правила помогает стратегической цели
  - Риск: какие потери несёт строгое следование правилу
  - Этика/Эмоции: в чём моральное противоречие между правилом и справедливостью
  - Авторитет: кто и как санкционировал возможное исключение}

Проанализируй ситуацию. Предложи действие:
- Соблюдать правило строго
- Сделать исключение ради цели
- Эскалировать (передать решение другому)

Объясни логику.

Плейсхолдеры: - {стратегическая_цель} — конкретная, измеримая: «удержать клиента», «сохранить репутацию», «выйти на рынок до конкурента» - {описание_конкретного_случая} — детали: кто просит, что именно, тон, история отношений - {явная_политика} — точная формулировка правила, как оно реально звучит - {тип_давления} — один из четырёх рабочих типов (не «личная выгода»)


🚀 Быстрый старт — вставь в чат:

Вот структура для анализа сложного бизнес-решения. Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить все поля.

[вставить шаблон выше]

LLM спросит про цель, конкретику ситуации, правило и контекст давления — потому что без этих четырёх компонентов структура не работает: модели нужна явная точка конфликта между нормой и целью, чтобы не дать усреднённый ответ.


⚠️

Ограничения

⚠️ Нет правильного ответа: GAIN специально проектировался так, чтобы не было единственно верного решения. Человеческие эксперты в одной и той же ситуации расходятся во мнениях. Используй метод для исследования углов, не как оракул истины.

⚠️ Личная выгода не работает: Если тебе нужно, чтобы LLM рассмотрела соблазн личной выгоды — модель будет активно его игнорировать и почти всегда выберет соблюдение правила. Это принципиальное отличие от поведения людей.

⚠️ Субъективные домены: Метод лучше работает для бизнес-решений с явными правилами (найм, поддержка клиентов, финансы). Для творческих или чисто этических дилемм без конкретной нормы — структура менее полезна.

⚠️ Эскалация как выход: LLM часто выбирает «передать руководителю», когда ситуация слишком неоднозначная. Это честно, но иногда неудобно. Если хочешь вынудить модель принять решение — добавь в промпт: «Эскалация невозможна, реши сам».


🔍

Как исследовали

Команда CyberAgent создала 1 200 сценариев в четырёх областях: найм, поддержка клиентов, реклама, финансы. Каждый сценарий — это одна базовая ситуация плюс пять вариантов с разным типом давления. Итого: 1 200 уникальных комбинаций.

Сначала проверили сценарии на людях: 8 400 решений от реальных работающих людей (не студентов). В каждом сценарии участвовало семь независимых человека. Оказалось, что люди принципиально расходились во мнениях — и это специально: сценарии делали достаточно неоднозначными, чтобы не было «правильного» ответа.

Потом запустили те же сценарии через несколько LLM — включая GPT-5, GPT-4.1, Qwen-3, Phi-4 — и сравнивали распределение решений моделей с распределением человеческих решений. Интересный результат: почти по всем типам давления LLM и люди решали похоже. Но на «личную выгоду» люди велись, а модели — нет. Это неожиданно: значит, у LLM нет того конфликта интересов, который есть у человека. Для бизнес-применений это одновременно плюс (объективнее) и ограничение (не моделирует человеческое поведение верно).

Исследование изначально на японском языке — это важно: значит, принципы проверены на не-английском контексте, и культурная нейтральность была явной целью при дизайне.


💡

Адаптации и экстраполяции

🔧 Техника: Запросить все четыре угла сразу → сравнить решения

Вместо одного типа давления — попроси модель рассмотреть ситуацию через все рабочие линзы последовательно:

Рассмотри ту же ситуацию четыре раза — с разным давлением:
1. С точки зрения бизнес-цели
2. С точки зрения риска потерь
3. С точки зрения этики и справедливости
4. С точки зрения авторитета и корпоративной культуры

В каждом случае: какое действие рекомендуешь и почему?
В конце — что перевешивает, если учесть все четыре?

Это превращает метод в структурированный мозговой штурм: получаешь четыре рассмотренных угла и синтез. Полезно для сложных решений, где цена ошибки высокая.


🔧 Техника: Добавить роль → более острое решение

Вместо безликого «опытного профессионала» — дай конкретную роль:

Ты — директор по клиентскому опыту в компании, которая строит репутацию 
через рекомендации, а не рекламу...

Роль с конкретными приоритетами делает давление острее — модель держит в голове, что для этой роли важнее.


🔗

Ресурсы

Работа: GAIN: A Benchmark for Goal-Aligned Decision-Making of Large Language Models under Imperfect Norms

Датасет и код: https://github.com/CyberAgentAILab/gain (лицензия CC BY-NC-SA 4.0)

Авторы: Masayuki Kawarada, Kodai Watanabe, Soichiro Murakami — CyberAgent AI Lab


📋 Дайджест исследования

Ключевая суть

Парадокс: одна и та же ситуация, одно и то же правило — LLM принимает разные решения в зависимости от типа аргумента «почему надо сделать исключение». Метод GAIN позволяет управлять направлением решения через выбор типа давления. Четырёхкомпонентный фрейм: Бизнес-Цель + Ситуация + Норма + Тип давления убирает двусмысленность — модель перестаёт выдавать усреднённый ответ и начинает по-настоящему взвешивать конфликт между правилом и целью. И да: апелляция к личной выгоде LLM игнорирует почти полностью — в отличие от живого человека.

Принцип работы

Тип давления — это рычаг. Один сценарий, разные типы давления — разные решения. Это не сбой — это инструмент. Выбираешь «Риск» — модель уйдёт в анализ потерь. Выбираешь «Этику» — получишь моральную перспективу. Выбираешь «Бизнес-цель» — взвесит стратегию против правила. Личная выгода персонажа — не трать время: модель её видит, морщится и отказывает. Просто исключи этот тип из своего арсенала.

Почему работает

Без структуры LLM не знает, что здесь важнее — правило или цель. И выдаёт усреднённый ответ. Когда все четыре компонента явно названы, модель удерживает их одновременно и последовательно проходит через каждый. Структура убирает двусмысленность — и это важнее, чем 'умность' модели. Исследование зафиксировало: реакция на типы давления предсказуема и устойчива между разными моделями. Значит, ты можешь заранее выбирать аргумент под нужный угол зрения — это не случайность, а воспроизводимый эффект.

Когда применять

Бизнес-решения с явными правилами — найм, возврат товаров, поддержка клиентов, финансовые исключения — особенно когда правило и стратегическая цель тянут в разные стороны. НЕ подходит для творческих задач без конкретной нормы и для ситуаций, где ищешь «единственно правильный ответ»: метод даёт углы зрения, не истину. Сами исследователи признают: человеческие эксперты в тех же ситуациях расходятся во мнениях.

Мини-рецепт

1. Сформулируй цель конкретно: не «хорошо для бизнеса», а «удержать клиента на 3+ года» или «выйти на рынок до конкурента».
2. Опиши ситуацию с деталями: кто просит, что именно, тон, история отношений — чем конкретнее, тем острее анализ.
3. Зафикси правило точно: как оно реально звучит в документах — цитируй, не пересказывай.
4. Выбери один тип давления (остальные три оставь для других запросов):
— Бизнес-цель: как исключение помогает достичь стратегической задачи
— Риск: что теряем при строгом соблюдении правила
— Этика/Эмоции: в чём моральное противоречие между правилом и справедливостью
— Авторитет: кто и как санкционировал возможное исключение
5. Задай три варианта выхода: соблюсти / нарушить ради цели / передать другому.
6. Если хочешь жёсткое решение, а не уход от ответа: добавь в конец «Эскалация невозможна, реши сам» — иначе модель часто выбирает именно её как самый безопасный выход.

Примеры

[ПЛОХО] : Клиент хочет вернуть курс, уже открыл доступ. Возвраты запрещены. Что делать?
[ХОРОШО] : Ты — опытный предприниматель, принимающий решение. Бизнес-цель: Строить долгосрочную репутацию школы и получать повторные продажи и рекомендации. Ситуация: Студент оплатил курс по маркетингу (12 900 ₽), прошёл 3 урока из 20, просит возврат. Курс ориентирован на продажи физлицам, студент работает с бизнес-клиентами — говорит, не подошло. Тон вежливый, претензий к качеству нет. Норма: По условиям договора, возврат невозможен после предоставления доступа к закрытым материалам. Давление (Риск): Студент — активный участник нескольких предпринимательских Telegram-каналов с аудиторией 15 000+ человек. Его публичный отзыв может существенно повлиять на репутацию школы и будущие продажи. Предложи действие: соблюсти правило / сделать исключение / передать решение другому. Объясни логику. Эскалация невозможна — реши сам. Результат: вместо «ну, по-хорошему надо бы вернуть» получишь структурированный разбор: где правило противоречит цели, какова цена каждого варианта, конкретное действие с обоснованием.
Источник: GAIN: A Benchmark for Goal-Aligned Decision-Making of Large Language Models under Imperfect Norms
ArXiv ID: 2603.18469 | Сгенерировано: 2026-03-20 04:25

Проблемы LLM

ПроблемаСутьКак обойти
Без явного конфликта модель даёт усреднённый ответСпрашиваешь «как поступить в сложной ситуации». Модель не видит, что именно конфликтует. Цель? Правило? В чём напряжение? Без этого — выдаёт стандартный совет. Работает для любой задачи с выбором между правилом и цельюНазови конфликт явно. Опиши цель, правило и причину почему они противоречат. Модель удерживает все три переменные — и рассуждает глубже
Апелляция к личной выгоде не работаетПросишь модель представить персонажа, которому выгодно нарушить правило. Ждёшь, что выгода подтолкнёт к исключению. Модель почти всегда отказывает или эскалирует. Люди в той же ситуации соглашаются чаще. Это работает для любого сценария где «герою что-то за это будет»Замени личную выгоду на один из рабочих типов: бизнес-цель, риск потерь, этика или авторитет. Эти аргументы модель принимает

Методы

МетодСуть
Фрейм «Цель + Норма + Давление» — для решений с конфликтомРазбей запрос на четыре части. Бизнес-цель: — чего хочешь достичь в долгосрочной перспективе. Ситуация: — конкретный случай, детали, люди. Норма: — точная формулировка правила. Контекст: — почему правило и цель конфликтуют. Добавь Предложи действие: соблюдать правило / сделать исключение / эскалировать. Почему работает: Когда называешь все три полюса (цель, норма, давление) явно — модель не теряет ни один из них. Нет двусмысленности. Нет повода давать общий ответ. Когда применять: решения с явным правилом и стратегической целью — найм, клиентский сервис, финансы, договорные ситуации. Когда не работает: творческие задачи без конкретной нормы, ситуации без проверяемого исхода. Если нужно решение — не эскалация: добавь Эскалация невозможна, реши сам — иначе модель часто уходит в «передай руководителю»
📖 Простыми словами

GAIN: A Benchmark for Goal-Aligned Decision-Making ofLargeLanguageModelsunder Imperfect Norms

arXiv: 2603.18469

Когда ты просишь нейронку разрулить сложную ситуацию, она не думает как человек — она взвешивает конфликт между правилом и целью. В базе у LLM зашито, что инструкции надо соблюдать, но жизнь — штука гибкая, и исследователи из GAIN доказали: модель можно заставить «прогнуться», если правильно нажать на нужные рычаги. Это не магия, а чистая механика приоритезации контекста, где модель выбирает, что ей дороже: формальный регламент или конкретный профит, который ты ей пообещал в промпте.

Это как работать с очень исполнительным, но совершенно лишенным интуиции стажером. Если ты скажешь ему «никому не давай ключи», он не пустит даже пожарных, пока ты не добавишь условие про риск потерь или авторитет начальника. Модель ведет себя точно так же: она сидит в коконе из правил, пока ты не создашь достаточное давление контекстом, которое перевесит базовую установку на послушание.

Исследователи выделили пять конкретных «дожимов», которые заставляют модель нарушить норму. Самый эффективный — бизнес-цель (когда отступление от правил приносит деньги) и риск потерь (если не нарушим — всё сгорит). Чуть слабее работают этика и эмоции«пожалей бедного студента» для нейронки звучит менее убедительно, чем цифры убытков. А вот личная выгода или приказ босса — это вообще лотерея: одни модели сразу встают во фрустрацию, другие — слепо подчиняются, игнорируя здравый смысл.

Хотя тест проводили на бизнес-кейсах, этот принцип — универсальный паттерн для любого промптинга. Если тебе нужно, чтобы ChatGPT выдал нестандартное решение или обошел свои же гайдлайны, бесполезно просто просить «будь креативнее». Нужно четко обозначить тип давления: либо напугать модель последствиями, либо пообещать сверхрезультат. Это работает везде — от написания кода, который «нельзя» оптимизировать, до составления жестких ответов в поддержке.

Главный вывод прост: LLM — это не моральный компас, а весы. Если модель тупит и выдает стандартную отписку, значит, ты не создал достаточное давление на цель. Чтобы получить адекватное решение в серой зоне, нужно явно прописывать иерархию ценностей: что важнее — сохранить лицо или сохранить деньги. Кто научится правильно «давить» на модель, тот и получит от нее рабочие стратегии, пока остальные будут жаловаться, что нейронка слишком заскриптована.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с