arXiv:2512.09254 70 9 дек. 2025 г. PRO

Иллюзия рациональности: как продвинутые LLM расходятся в стратегиях переговоров

КЛЮЧЕВАЯ СУТЬ

Парадокс: GPT-4.1 и GPT-4.1 mini показывают идентичные результаты на reasoning-бенчмарках, но в переговорных симуляциях расходятся на 30-40% по выплатам. Исследование прогнало 6 топовых моделей через игры «Продавец-Покупатель» и обнаружило: вместо схождения к единому рациональному поведению модели расползаются в уникальные стратегические ниши. Gemini 2.5 Pro доминирует в обеих ролях, Claude 4.5 Sonnet силён как продавец но слаб как покупатель, GPT-4.1 mini проигрывает везде. Главная слабость всех моделей — эффект якоря: первое названное число определяет финальную цену с корреляцией 0.78–0.91, даже если это число взято с потолка.

Адаптировать под запрос

Контент доступен только для PRO подписчиков

Чтобы получить доступ к полному содержанию этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

Выберите модель ИИ:

Ваш запрос:

0 / 2000

~0.5-2 N-токенов ~10-30с

~0.3-1 N-токенов ~5-15с

Что это такое?

Это исследование о том, как современные LLM (GPT-4.1, Claude 4.5, Gemini 2.5 и др.) ведут себя в переговорах. Авторы проверили их на трёх играх: Продавец-Покупатель, Многоходовой Ультиматум, Обмен Ресурсами.

Ключевые находки:

Стратегическая дивергенция — модели НЕ сходятся к одному рациональному равновесию. Каждая модель занимает свою уникальную "стратегическую нишу".

Эффект якоря (anchoring) — первое предложение сильно влияет на финальное. Корреляция 0.78-0.91!

Семантический якорь — модели "схлопывают" разные внутренние оценки в стандартные круглые числа (50, 60, 70).

Доминирование — некоторые модели систематически выигрывают у других. Gemini 2.5 Pro выигрывает в обеих ролях.

Что можно применить в чате?

Это НЕ техника промптинга. Это ИССЛЕДОВАНИЕ о слабостях LLM. Но из него можно извлечь практические принципы:

Принципы для применения:

Первое число имеет значение — если ты первый называешь цену/число, ты задаёшь якорь.

Выбор модели влияет на исход — разные модели применяют разные стратегии в переговорах, и некоторые более успешны, чем другие.

Ожидай округлённых ответов — модели предпочитают круглые числа (50, 60, 70) вместо точных расчётов.

Каждая модель имеет точку переключения — существует порог, при котором модель меняет свой подход.

Как применить?

Сценарий 1: Ты используешь LLM для переговоров

Помни, что первое предложение задаёт направление всего диалога

Начинай с якоря, который выгоден тебе

Явно попроси модель считать точные значения, а не округлять

Сценарий 2: Ты анализируешь переговоры через LLM

Запроси оценку у нескольких моделей — каждая предложит свою стратегическую линию

Gemini 2.5 Pro более агрессивна в переговорах, Claude 4.5 Sonnet лучше справляется с ролью продавца

Сценарий 3: Нейтрализация якоря

Попроси модель игнорировать первоначальное число

Дай ей определить справедливую цену независимо, до того как она узнает о предложении

Остаётся открытым вопрос: насколько эти выводы применимы в реальных ситуациях

. Исследование показало, как LLM ведут себя в симуляциях переговоров через API с 120 партиями на каждую модель, но это скорее научная находка, чем готовая к применению техника. Ценность в том, что я теперь понимаю, какие стратегические слабости есть у моделей и как их поведение меняется в зависимости от контекста — это помогает выбрать нужную модель для конкретной задачи и писать более эффективные промпты.

Оценка 70 кажется справедливой. Инсайты про якоря и выбор модели действительно практичны и извлекаемы, но отсутствие готового шаблона или пошаговой техники снижает ценность — это больше "знай об этом" чем "делай так". Нужно самому додумывать, как адаптировать эти принципы к своей задаче.

Меню

Иллюзия рациональности: как продвинутые LLM расходятся в стратегиях переговоров

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Работа с исследованием

Результат адаптации