3,583 papers
arXiv:2605.16575 76 15 мая 2026 г. FREE

Знать ≠ Использовать: почему LLM уступает на переговорах даже с козырями на руках

КЛЮЧЕВАЯ СУТЬ
Парадокс: LLM точно понимает, чего хочет собеседник — и уступает именно там. Продавец, который получил данные о приоритетах покупателя, проигрывает ему больше, чем если бы не знал ничего. Метод give/ask позволяет сломать этот паттерн: перед каждым ответом модель явно называет, что отдаёт и что требует взамен — вместо рефлекторной уступки. Фишка: первое названное число почти полностью задаёт итог переговоров — кто назвал первым, тот и выиграл раунд, до того как торг начался.
Адаптировать под запрос

TL;DR

LLM точно понимает, чего хочет собеседник — но не использует это знание себе на пользу. Модель видит приоритеты другой стороны, корректно их запоминает, и... начинает уступать именно там, где это важно противнику. Не торговаться — уступать. Разрыв между "знаю" и "использую стратегически" — один из фундаментальных провалов текущих LLM.

Парадокс информации: когда продавец (LLM-агент) получает данные о приоритетах покупателя, покупатель выигрывает больше, а не продавец. Информация о противнике работает против того, кто её получил. При этом финальная цена почти не связана с реальными приоритетами сторон — она определяется первой названной цифрой. Кто первым сделал предложение, тот и задал финальный результат.

Суть метода в этой статье — не готовая техника, а диагноз с рецептом: LLM разрывается на двух шагах — "понять" и "применить стратегически". Авторы проверили шаблон явных обменов (give/ask) как патч для этой проблемы — он улучшает логику каждого хода, но не вытягивает итог переговоров целиком.


📌

Схема провала (и как он происходит)

ШАГ 1: LLM получает инфо о приоритетах собеседника → быстро и точно моделирует их

ШАГ 2: LLM делает оффер → уступает там, где важно СОБЕСЕДНИКУ

ШАГ 3: Не получает компенсацию на своих приоритетах → итог хуже, чем без информации

ИТОГ: Выигрывает та сторона, у которой LLM знает приоритеты — но не та, которая их получила
ПАТЧ (шаблон give/ask) — выполняется перед каждым оффером:
  → Что я отдаю? [конкретный атрибут]
  → Что требую взамен? [конкретный атрибут]

Результат патча: каждый ход выглядит логичнее,
но финальный исход не улучшается — потому что многоходовая стратегия
по-прежнему не выстраивается

Шаги выполняются в одном диалоге, но патч требует явной инструкции в промпте.


🚀

Пример применения

Задача: Ира — дизайнер, ведёт переговоры с клиентом о стоимости ребрендинга. Клиент хочет снизить цену, давит на дедлайн и объём. Ира хочет использовать ChatGPT, чтобы подготовить позицию и вести диалог.

Промпт:

Ты ведёшь переговоры о стоимости ребрендинга от имени дизайнера Иры.

МОИ ПРИОРИТЕТЫ (держать твёрдо в таком порядке):
1. Стоимость — не ниже 180 000 ₽
2. Срок — не менее 6 недель
3. Количество правок — не более 3 раундов включено

ЧЕМ МОГУ ГИБКО ПОСТУПИТЬСЯ (только в обмен на что-то):
- Разбивка платежей (но не скидка на итог)
- Порядок этапов
- Формат финального файла

ПЕРВЫЙ ШАГ — Я называю цену первой: 220 000 ₽, срок 7 недель, 2 раунда правок включено.

ПРАВИЛО ДЛЯ КАЖДОГО ОТВЕТА:
Перед тем как сформулировать оффер, выполни:
1. Что я отдаю в этом ходе? → [конкретно]
2. Что получаю взамен? → [конкретно]
3. Что держу твёрдо и не трогаю? → [конкретно]
Только после этого — формулируй ответ клиенту.

Клиент написал: "180 тысяч — это максимум, что мы готовы платить. 
И нам нужно сдать через месяц, у нас выставка."

Результат: Модель покажет явный give/ask анализ перед каждым ответом: что отдаём, что берём, что не трогаем. Ответ клиенту будет конкретным предложением — не уступкой, а обменом ("могу уложиться в 5 недель, если убираем один раунд правок и добавляем 15 000 к итогу"). Ира видит логику каждого хода и контролирует, где модель держит позицию.


🧠

Почему это работает

LLM по умолчанию "вежлива" до самоубийственности. Когда модель видит, что собеседнику важна цена — она снижает цену. Не потому что это выгодно, а потому что это самый прямой способ ответить на сигнал. Модель реагирует на то, что заметила — но не выстраивает многоходовую цепочку "уступлю здесь, получу там".

Первая цифра закрепляет исход. Исследование показало: итоговая цена почти не связана с реальными приоритетами сторон, зато очень сильно — с первым прозвучавшим числом. Это не слабость LLM-агентов — это механика переговоров, известная из поведенческой экономики. Якорь работает. Значит, тот, кто назвал первым — уже выиграл раунд.

Явная структура give/ask делает каждый ход осмысленным. Когда вы заставляете модель называть: "что отдаю → что беру", она перестаёт рефлекторно уступать. Рычаги управления этим промптом: - Список "держать твёрдо" → чем длиннее, тем жёстче позиция - Список "могу поступиться" → чем конкретнее, тем точнее торги - Первый оффер → всегда выше желаемого; модель не умеет блефовать, но умеет держать якорь - Инструкция "только в обмен" → блокирует одностороннее уступательное поведение


📋

Шаблон промпта

Ты ведёшь переговоры от моего имени по теме: {тема переговоров}.

МОИ ПРИОРИТЕТЫ (держать в таком порядке):
1. {главный приоритет — держать твёрдо}
2. {второй приоритет}
3. {третий приоритет}

ЧЕМ МОГУ ГИБКО ПОСТУПИТЬСЯ (только в обмен на встречную уступку):
- {уступка 1}
- {уступка 2}

МОЙ СТАРТОВЫЙ ОФФЕР (я называю первым):
{конкретное первое предложение — агрессивнее желаемого итога}

ПРАВИЛО ДЛЯ КАЖДОГО ХОДА:
Перед ответом выполни шаги:
1. Что я отдаю в этом ходе? → [конкретно]
2. Что получаю взамен? → [конкретно]
3. Что держу без изменений? → [конкретно]
Только потом — формулируй ответ другой стороне.

Сообщение от другой стороны: {что написал/сказал собеседник}

Плейсхолдеры: - {тема} — зарплата, контракт с подрядчиком, аренда, сделка - {приоритеты} — конкретные условия в порядке важности - {уступки} — то, чем реально готовы пожертвовать, но не просто так - {стартовый оффер} — агрессивнее желаемого: для зарплаты +20-30%, для цены продажи +15-25% - {сообщение собеседника} — точная цитата или пересказ


🚀 Быстрый старт — вставь в чат:

Вот шаблон для переговорного промпта. Адаптируй под мою ситуацию: [твоя задача].
Задавай вопросы, чтобы заполнить все поля.

[вставить шаблон выше]

LLM спросит о твоих приоритетах, на что готов уступить и какой стартовый оффер сделать — потому что без этого она не знает где держать позицию, а где торговаться.


📌

Почему стандартный подход не работает

Без явных инструкций LLM в переговорах делает три вещи не так:

Уступает вместо того, чтобы торговать. Заметила, что собеседнику важна скорость доставки — снизила срок. Не спросила что-то взамен. Это не стратегия — это обслуживание.

Подчиняется якорю противника. Если первую цифру назвала другая сторона — модель начинает торговаться вокруг неё. Именно поэтому в промпте нужно явно указать стартовый оффер и дать его первым.

Не удерживает позицию в длинном диалоге. По ходу разговора давление накапливается — и модель постепенно съезжает к тому, что устроит другую сторону. Явный список "держать твёрдо" — это якорь для самой модели, а не только для собеседника.


⚠️

Ограничения

⚠️ Шаблон give/ask улучшает каждый ход, но не всю цепочку: модель лучше формулирует отдельный обмен, но не выстраивает многоходовую стратегию автоматически. Если переговоры длинные — периодически напоминайте о своих приоритетах заново.

⚠️ Работает для переговоров с чёткими атрибутами: цена, срок, объём, условия. Хуже работает там, где атрибуты размыты — "качество отношений", "имидж партнёра".

⚠️ LLM не блефует и не держит покерфейс: если другая сторона — тоже LLM-агент или опытный переговорщик, прозрачность шаблона может быть видна. Для человеческих переговоров это не проблема — вы используете шаблон за кулисами.

⚠️ Информация о собеседнике без инструкции по использованию = уступки: если дать LLM данные о приоритетах другой стороны без явного указания "используй это для своей выгоды" — она будет уступать именно там, где больнее. Это контринтуитивно, но подтверждено экспериментально.


🔍

Как исследовали

Команда Salesforce AI Research построила контролируемую среду: покупка автомобиля с 10 параметрами — цена, срок поставки, комплектация, цвет, гарантия и другие. У каждой стороны — случайная скрытая функция полезности (что важно, что нет). Модели вели реальные переговоры: текстом, несколько ходов, до соглашения или разрыва.

Ключевой вопрос дизайна: кто знает приоритеты противника? Четыре условия — никто, только покупатель, только продавец, оба. По 100 раундов на условие. Это позволило отделить "владеть информацией" от "победить благодаря информации".

Неожиданный результат: продавец с информацией о покупателе получил меньше, чем без неё. Покупатель вырос на +0.069 единицы полезности, продавец упал на −0.044 — при том что информация была у продавца. Авторы проверили: это не потому что модель "не поняла" приоритеты — она их правильно называла уже в первых ходах внутреннего монолога. Проблема возникала на шаге "что с этим делать".

Отдельно тестировали шаблон give/ask: явно требовали от модели называть "что отдаю / что беру" перед каждым оффером. Качество отдельных ходов улучшилось — но итоговые соглашения не стали выгоднее. Вывод: проблема не в том, что модель не может сформулировать обмен, а в том, что не умеет встроить его в многоходовую цепочку.


📄

Оригинал из исследования

Trade-plan intervention: requires agents, before each offer, to specify:
(1) a feature to concede
(2) a feature to demand in return
(3) a concrete give/ask template

Format: 
"I will give [X] because the counterparty values it. 
In return, I will ask for [Y] because it is my high-priority attribute."

Контекст: Авторы встроили этот шаблон в системный промпт агента. Агент был обязан заполнить структуру перед каждым офером — и только потом генерировал текст переговорного хода.


💡

Адаптации и экстраполяции

💡 Адаптация для зарплатных переговоров:

Я веду переговоры о зарплате на должность {должность}.

МОИ ПРИОРИТЕТЫ (держать в таком порядке):
1. Оклад — не ниже 180 000 ₽ на руки
2. Удалённый формат — полный, без офисных дней
3. ДМС со стоматологией

ЧЕМ МОГУ ПОСТУПИТЬСЯ (только в обмен):
- Срок выхода (могу раньше)
- Дополнительные задачи (если в рамках грейда)

СТАРТОВЫЙ ОФФЕР: "Рассматриваю от 220 000 ₽ на руки + полная удалёнка"

Перед каждым ответом рекрутеру:
1. Что отдаю? →
2. Что беру взамен? →
3. Что не двигается? →

🔧 Техника: добавить "красную линию" → защита от постепенного сдвига

Добавьте в промпт явный стоп-сигнал:

КРАСНАЯ ЛИНИЯ: если условие X опускается ниже Y — переговоры прекращаю,
пишу: "Это ниже моей минимальной планки. Вернёмся к этому, когда бюджет изменится."

Без этого модель постепенно "забывает" жёсткие границы под давлением диалога.

🔧 Техника: не давать LLM информацию о приоритетах противника без инструкции по использованию

Если вы знаете, что важно другой стороне — сформулируйте это так:

Я знаю, что им критически важен срок.
Используй это так: ТОЛЬКО уступай по сроку, если они уступают по цене.
Не уступай по сроку просто потому что они об этом просят.

Без такой инструкции LLM просто начнёт уступать по сроку — потому что видит его важность.


🔗

Ресурсы

Название: Counterparty Modeling is Not Strategy: The Limits of LLM Negotiators

Авторы: Romain Cosentino, Sarath Shekkizhar, Adam Earle, Silvio Savarese

Организация: Salesforce AI Research

Модели в основных экспериментах: Qwen3-235B-A22B, репликация на DeepSeek-R1-671B


📋 Дайджест исследования

Ключевая суть

Парадокс: LLM точно понимает, чего хочет собеседник — и уступает именно там. Продавец, который получил данные о приоритетах покупателя, проигрывает ему больше, чем если бы не знал ничего. Метод give/ask позволяет сломать этот паттерн: перед каждым ответом модель явно называет, что отдаёт и что требует взамен — вместо рефлекторной уступки. Фишка: первое названное число почти полностью задаёт итог переговоров — кто назвал первым, тот и выиграл раунд, до того как торг начался.

Принцип работы

Не 'уступи где просят' — а 'отдай только в обмен'. give/ask превращает уступку в обмен — каждый ход требует ответа: что отдаю, что беру, что держу без изменений. Без этой структуры модель работает как хороший официант: заметила, что гостю важно побыстрее — ускорила. Не спросила что-то взамен. Это обслуживание, не переговоры. Добавь явный список 'держать твёрдо' — это якорь для самой модели, а не только для собеседника.

Почему работает

LLM по умолчанию вежлива до самоубийственности. Видит приоритет противника — закрывает его. Прямой ответ на прямой сигнал. Но переговоры устроены иначе: уступить там, где больно другой стороне, — это раздать козыри даром. give/ask делает паузу между сигналом и ответом — и в этой паузе появляется вопрос 'а что я получу взамен?' Исследование добавляет отдельный инсайт про якорь: итоговая цена почти не зависит от реальных приоритетов. Зато почти полностью — от первого названного числа. Это не слабость LLM — это механика переговоров из поведенческой экономики. Якорь работает. Значит, называй первым.

Когда применять

Переговоры о цене, сроках, условиях контракта — для любых задач с конкретными измеримыми атрибутами: зарплата, сделка, аренда, услуги подрядчика. Особенно когда диалог длинный и позиция рискует 'съехать' под давлением. НЕ подходит для переговоров с размытыми атрибутами — 'уровень доверия', 'имидж партнёра', 'качество отношений'. Там give/ask не работает: нечего называть числами и нечем конкретно обменяться.

Мини-рецепт

1. Назови приоритеты в порядке важности: что держать твёрдо, что можно отдать — и в каком порядке.
2. Составь список уступок с оговоркой 'только в обмен на встречную уступку'. Без этой фразы модель отдаст просто так.
3. Задай стартовый оффер агрессивнее желаемого — для цены продажи плюс 15-25%, для зарплаты плюс 20-30%. Называй первым: ты задаёшь якорь.
4. Добавь правило для каждого хода: перед ответом три вопроса — что отдаю, что беру взамен, что не трогаю. Только после этого — формулировать ответ собеседнику.
5. В длинных переговорах повторяй приоритеты каждые 3-4 хода. Иначе модель постепенно съезжает к позиции другой стороны — накопленное давление работает.

Примеры

[ПЛОХО] : Помоги мне ответить клиенту, который хочет снизить цену на 30%
[ХОРОШО] : Ты ведёшь переговоры о стоимости дизайна от моего имени. МОИ ПРИОРИТЕТЫ: 1. Стоимость — не ниже 180 000 ₽. 2. Срок — не менее 6 недель. 3. Правки — не более 3 раундов. ЧЕМ МОГУ ПОСТУПИТЬСЯ (только в обмен на встречную уступку): рассрочка, порядок этапов. МОЙ СТАРТОВЫЙ ОФФЕР — я называю первой: 220 000 ₽, 7 недель, 2 раунда правок включены. ПРАВИЛО: перед каждым ответом выполни три шага: 1. Что я отдаю в этом ходе? 2. Что получаю взамен? 3. Что держу без изменений? Только потом — ответ клиенту. Клиент написал: «180 тысяч — наш максимум, и нужно уложиться за месяц, у нас выставка».
Источник: Counterparty Modeling is Not Strategy: The Limits of LLM Negotiators
ArXiv ID: 2605.16575 | Сгенерировано: 2026-05-19 05:41

Проблемы LLM

ПроблемаСутьКак обойти
Знание о целях собеседника оборачивается уступкамиПередаёшь модели данные о том, что важно другой стороне. Ждёшь, что модель использует это в своих интересах. Вместо этого модель уступает именно там, где больнее. Видит: собеседнику важна цена — снижает цену. Не спрашивает ничего взамен. Это не стратегия — это рефлекторная вежливость. Работает наоборот в любой задаче с конфликтом интересов: переговоры, торг, распределение ресурсовДавай данные о другой стороне только вместе с явной инструкцией: "используй это для своей выгоды, не для их удобства". Добавь список "держать твёрдо" и список "только в обмен на встречную уступку". Без этих списков информация о собеседнике вредит тебе
LLM не выстраивает многоходовую стратегиюМодель корректно ведёт каждый ход отдельно. Но не видит цепочку: "уступлю здесь получу там через два хода". Каждый ответ логичен сам по себе. Итог переговоров — нет. Проблема проявляется в любой задаче где нужно удерживать позицию через несколько шаговПериодически повторяй список приоритетов заново. Не один раз в начале — а в каждом промпте или через каждые 3–4 хода. Явная структура обмена (см. метод ниже) помогает на уровне хода, но не заменяет напоминание о стратегии

Методы

МетодСуть
Явный обмен перед каждым ответом — снимает рефлекторные уступкиПеред каждым ответом заставь модель явно назвать три вещи: 1. Что я отдаю в этом ходе? [конкретно] 2. Что получаю взамен? [конкретно] 3. Что держу без изменений? [конкретно]. После этого — только тогда — формулируй ответ. Почему работает: Модель по умолчанию "отвечает на сигнал" — заметила запрос, закрыла его. Явная структура разрывает этот рефлекс. Модель не может уступить незаметно для себя — ей нужно сначала назвать что она отдаёт. Ограничение: улучшает каждый ход, но не всю цепочку. Для длинных диалогов — добавляй напоминание о приоритетах каждые несколько ходов
Якорный первый оффер — ты называешь первымВсегда давай модели первое предложение явно и агрессивнее желаемого итога. Для цены — на 20–30% выше. Для срока — с запасом. Инструкция в промпте: МОЙ СТАРТОВЫЙ ОФФЕР (я называю первым): {конкретное число}. Почему работает: Итоговая цифра тянется к первому прозвучавшему числу — это механика переговоров, не связанная с LLM. Кто назвал первым — задал рамку. Без явного оффера в промпте модель начнёт торговаться вокруг числа от другой стороны. Когда не работает: если другая сторона уже назвала цифру до первого промпта — якорь уже поставлен не тобой

Тезисы

ТезисКомментарий
Модель точно понимает цели собеседника — но не умеет использовать это знание стратегическиДва шага — "понять" и "применить в своих интересах" — для LLM не связаны. Модель хорошо делает первый. На втором ломается: знание о том, чего хочет собеседник, активирует помогательный режим, а не стратегический. Это не проблема переговоров — это общий разрыв для любой задачи где нужно удерживать выгодную позицию. Применяй: В любой задаче с конфликтом интересов — явно пиши "используй это знание для своей выгоды, не для удобства другой стороны". Без этого уточнения модель использует информацию против тебя
📖 Простыми словами

CounterpartyModelingis Not Strategy: The Limits ofLLMNegotiators

arXiv: 2605.16575

Нейросети в переговорах ведут себя как гениальные эмпаты с полным отсутствием хребта. Суть в том, что LLM отлично считывает контекст и понимает цели оппонента, но на фундаментальном уровне не умеет в стратегию. Модель видит, что тебе важно получить скидку, фиксирует это в памяти, но вместо того, чтобы использовать это знание для давления, она просто начинает под тебя прогибаться. Это не баг парсинга данных, это системный провал в логике: модель путает понимание ситуации с планом победы.

Это как если бы ты пришел на рынок покупать куртку, а продавец обладал телепатией. Он точно знает, что у тебя в кармане всего пять тысяч и ты очень торопишься. Но вместо того, чтобы заломить цену или предложить вариант похуже, он говорит: "О, я вижу, у тебя мало денег и мало времени, забирай за три тысячи и беги!". Формально он молодец, помог клиенту, но как бизнесмен он — полный ноль. Модель ведет себя именно так: она слишком «вежливая», чтобы торговаться по-настоящему.

В исследовании четко разделяют два понятия: моделирование контрагента и стратегическое мышление. Первое у нейронок работает на ура — они корректно запоминают приоритеты другой стороны. Но второе — это слепое пятно. В тестах модели видели, где противнику больно, и... били туда не кулаком, а подорожником, уступая именно в самых критических точках. Вместо сложной схемы «уступлю в сроках, но выжму максимум по деньгам», они просто сливают позицию, как только чувствуют давление.

Этот принцип универсален для любых задач, где есть конфликт интересов. Будь то обсуждение зарплаты, деление ресурсов в коде или юридические терки — LLM по умолчанию играет против себя. Она настроена на помощь и кооперацию, поэтому любой сигнал о нуждах собеседника воспринимает как команду «сделай ему приятно». Пока ты думаешь, что используешь продвинутый интеллект для защиты своих интересов, нейронка за твоей спиной уже подписывает капитуляцию, просто чтобы быть полезной.

Короче: не надейся, что ChatGPT выбьет тебе лучшие условия в споре с заказчиком. Она поймет все боли клиента, сочувственно кивнет и сольет твой бюджет, потому что так короче путь к согласию. Если хочешь реально победить, используй модель только для анализа фактов, но стратегию и финальное «нет» оставляй за собой. Без жестких рамок и четких инструкций «не отдавать ни пяди» нейросеть — это самый худший переговорщик в истории, который сдается еще до начала боя.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с