TL;DR
LLM точно понимает, чего хочет собеседник — но не использует это знание себе на пользу. Модель видит приоритеты другой стороны, корректно их запоминает, и... начинает уступать именно там, где это важно противнику. Не торговаться — уступать. Разрыв между "знаю" и "использую стратегически" — один из фундаментальных провалов текущих LLM.
Парадокс информации: когда продавец (LLM-агент) получает данные о приоритетах покупателя, покупатель выигрывает больше, а не продавец. Информация о противнике работает против того, кто её получил. При этом финальная цена почти не связана с реальными приоритетами сторон — она определяется первой названной цифрой. Кто первым сделал предложение, тот и задал финальный результат.
Суть метода в этой статье — не готовая техника, а диагноз с рецептом: LLM разрывается на двух шагах — "понять" и "применить стратегически". Авторы проверили шаблон явных обменов (give/ask) как патч для этой проблемы — он улучшает логику каждого хода, но не вытягивает итог переговоров целиком.
Схема провала (и как он происходит)
ШАГ 1: LLM получает инфо о приоритетах собеседника → быстро и точно моделирует их
ШАГ 2: LLM делает оффер → уступает там, где важно СОБЕСЕДНИКУ
ШАГ 3: Не получает компенсацию на своих приоритетах → итог хуже, чем без информации
ИТОГ: Выигрывает та сторона, у которой LLM знает приоритеты — но не та, которая их получила
ПАТЧ (шаблон give/ask) — выполняется перед каждым оффером:
→ Что я отдаю? [конкретный атрибут]
→ Что требую взамен? [конкретный атрибут]
Результат патча: каждый ход выглядит логичнее,
но финальный исход не улучшается — потому что многоходовая стратегия
по-прежнему не выстраивается
Шаги выполняются в одном диалоге, но патч требует явной инструкции в промпте.
Пример применения
Задача: Ира — дизайнер, ведёт переговоры с клиентом о стоимости ребрендинга. Клиент хочет снизить цену, давит на дедлайн и объём. Ира хочет использовать ChatGPT, чтобы подготовить позицию и вести диалог.
Промпт:
Ты ведёшь переговоры о стоимости ребрендинга от имени дизайнера Иры.
МОИ ПРИОРИТЕТЫ (держать твёрдо в таком порядке):
1. Стоимость — не ниже 180 000 ₽
2. Срок — не менее 6 недель
3. Количество правок — не более 3 раундов включено
ЧЕМ МОГУ ГИБКО ПОСТУПИТЬСЯ (только в обмен на что-то):
- Разбивка платежей (но не скидка на итог)
- Порядок этапов
- Формат финального файла
ПЕРВЫЙ ШАГ — Я называю цену первой: 220 000 ₽, срок 7 недель, 2 раунда правок включено.
ПРАВИЛО ДЛЯ КАЖДОГО ОТВЕТА:
Перед тем как сформулировать оффер, выполни:
1. Что я отдаю в этом ходе? → [конкретно]
2. Что получаю взамен? → [конкретно]
3. Что держу твёрдо и не трогаю? → [конкретно]
Только после этого — формулируй ответ клиенту.
Клиент написал: "180 тысяч — это максимум, что мы готовы платить.
И нам нужно сдать через месяц, у нас выставка."
Результат:
Модель покажет явный give/ask анализ перед каждым ответом: что отдаём, что берём, что не трогаем. Ответ клиенту будет конкретным предложением — не уступкой, а обменом ("могу уложиться в 5 недель, если убираем один раунд правок и добавляем 15 000 к итогу"). Ира видит логику каждого хода и контролирует, где модель держит позицию.
Почему это работает
LLM по умолчанию "вежлива" до самоубийственности. Когда модель видит, что собеседнику важна цена — она снижает цену. Не потому что это выгодно, а потому что это самый прямой способ ответить на сигнал. Модель реагирует на то, что заметила — но не выстраивает многоходовую цепочку "уступлю здесь, получу там".
Первая цифра закрепляет исход. Исследование показало: итоговая цена почти не связана с реальными приоритетами сторон, зато очень сильно — с первым прозвучавшим числом. Это не слабость LLM-агентов — это механика переговоров, известная из поведенческой экономики. Якорь работает. Значит, тот, кто назвал первым — уже выиграл раунд.
Явная структура give/ask делает каждый ход осмысленным. Когда вы заставляете модель называть: "что отдаю → что беру", она перестаёт рефлекторно уступать. Рычаги управления этим промптом:
- Список "держать твёрдо" → чем длиннее, тем жёстче позиция
- Список "могу поступиться" → чем конкретнее, тем точнее торги
- Первый оффер → всегда выше желаемого; модель не умеет блефовать, но умеет держать якорь
- Инструкция "только в обмен" → блокирует одностороннее уступательное поведение
Шаблон промпта
Ты ведёшь переговоры от моего имени по теме: {тема переговоров}.
МОИ ПРИОРИТЕТЫ (держать в таком порядке):
1. {главный приоритет — держать твёрдо}
2. {второй приоритет}
3. {третий приоритет}
ЧЕМ МОГУ ГИБКО ПОСТУПИТЬСЯ (только в обмен на встречную уступку):
- {уступка 1}
- {уступка 2}
МОЙ СТАРТОВЫЙ ОФФЕР (я называю первым):
{конкретное первое предложение — агрессивнее желаемого итога}
ПРАВИЛО ДЛЯ КАЖДОГО ХОДА:
Перед ответом выполни шаги:
1. Что я отдаю в этом ходе? → [конкретно]
2. Что получаю взамен? → [конкретно]
3. Что держу без изменений? → [конкретно]
Только потом — формулируй ответ другой стороне.
Сообщение от другой стороны: {что написал/сказал собеседник}
Плейсхолдеры:
- {тема} — зарплата, контракт с подрядчиком, аренда, сделка
- {приоритеты} — конкретные условия в порядке важности
- {уступки} — то, чем реально готовы пожертвовать, но не просто так
- {стартовый оффер} — агрессивнее желаемого: для зарплаты +20-30%, для цены продажи +15-25%
- {сообщение собеседника} — точная цитата или пересказ
🚀 Быстрый старт — вставь в чат:
Вот шаблон для переговорного промпта. Адаптируй под мою ситуацию: [твоя задача].
Задавай вопросы, чтобы заполнить все поля.
[вставить шаблон выше]
LLM спросит о твоих приоритетах, на что готов уступить и какой стартовый оффер сделать — потому что без этого она не знает где держать позицию, а где торговаться.
Почему стандартный подход не работает
Без явных инструкций LLM в переговорах делает три вещи не так:
Уступает вместо того, чтобы торговать. Заметила, что собеседнику важна скорость доставки — снизила срок. Не спросила что-то взамен. Это не стратегия — это обслуживание.
Подчиняется якорю противника. Если первую цифру назвала другая сторона — модель начинает торговаться вокруг неё. Именно поэтому в промпте нужно явно указать стартовый оффер и дать его первым.
Не удерживает позицию в длинном диалоге. По ходу разговора давление накапливается — и модель постепенно съезжает к тому, что устроит другую сторону. Явный список "держать твёрдо" — это якорь для самой модели, а не только для собеседника.
Ограничения
⚠️ Шаблон give/ask улучшает каждый ход, но не всю цепочку: модель лучше формулирует отдельный обмен, но не выстраивает многоходовую стратегию автоматически. Если переговоры длинные — периодически напоминайте о своих приоритетах заново.
⚠️ Работает для переговоров с чёткими атрибутами: цена, срок, объём, условия. Хуже работает там, где атрибуты размыты — "качество отношений", "имидж партнёра".
⚠️ LLM не блефует и не держит покерфейс: если другая сторона — тоже LLM-агент или опытный переговорщик, прозрачность шаблона может быть видна. Для человеческих переговоров это не проблема — вы используете шаблон за кулисами.
⚠️ Информация о собеседнике без инструкции по использованию = уступки: если дать LLM данные о приоритетах другой стороны без явного указания "используй это для своей выгоды" — она будет уступать именно там, где больнее. Это контринтуитивно, но подтверждено экспериментально.
Как исследовали
Команда Salesforce AI Research построила контролируемую среду: покупка автомобиля с 10 параметрами — цена, срок поставки, комплектация, цвет, гарантия и другие. У каждой стороны — случайная скрытая функция полезности (что важно, что нет). Модели вели реальные переговоры: текстом, несколько ходов, до соглашения или разрыва.
Ключевой вопрос дизайна: кто знает приоритеты противника? Четыре условия — никто, только покупатель, только продавец, оба. По 100 раундов на условие. Это позволило отделить "владеть информацией" от "победить благодаря информации".
Неожиданный результат: продавец с информацией о покупателе получил меньше, чем без неё. Покупатель вырос на +0.069 единицы полезности, продавец упал на −0.044 — при том что информация была у продавца. Авторы проверили: это не потому что модель "не поняла" приоритеты — она их правильно называла уже в первых ходах внутреннего монолога. Проблема возникала на шаге "что с этим делать".
Отдельно тестировали шаблон give/ask: явно требовали от модели называть "что отдаю / что беру" перед каждым оффером. Качество отдельных ходов улучшилось — но итоговые соглашения не стали выгоднее. Вывод: проблема не в том, что модель не может сформулировать обмен, а в том, что не умеет встроить его в многоходовую цепочку.
Оригинал из исследования
Trade-plan intervention: requires agents, before each offer, to specify:
(1) a feature to concede
(2) a feature to demand in return
(3) a concrete give/ask template
Format:
"I will give [X] because the counterparty values it.
In return, I will ask for [Y] because it is my high-priority attribute."
Контекст: Авторы встроили этот шаблон в системный промпт агента. Агент был обязан заполнить структуру перед каждым офером — и только потом генерировал текст переговорного хода.
Адаптации и экстраполяции
💡 Адаптация для зарплатных переговоров:
Я веду переговоры о зарплате на должность {должность}. МОИ ПРИОРИТЕТЫ (держать в таком порядке): 1. Оклад — не ниже 180 000 ₽ на руки 2. Удалённый формат — полный, без офисных дней 3. ДМС со стоматологией ЧЕМ МОГУ ПОСТУПИТЬСЯ (только в обмен): - Срок выхода (могу раньше) - Дополнительные задачи (если в рамках грейда) СТАРТОВЫЙ ОФФЕР: "Рассматриваю от 220 000 ₽ на руки + полная удалёнка" Перед каждым ответом рекрутеру: 1. Что отдаю? → 2. Что беру взамен? → 3. Что не двигается? →
🔧 Техника: добавить "красную линию" → защита от постепенного сдвига
Добавьте в промпт явный стоп-сигнал:
КРАСНАЯ ЛИНИЯ: если условие X опускается ниже Y — переговоры прекращаю, пишу: "Это ниже моей минимальной планки. Вернёмся к этому, когда бюджет изменится."Без этого модель постепенно "забывает" жёсткие границы под давлением диалога.
🔧 Техника: не давать LLM информацию о приоритетах противника без инструкции по использованию
Если вы знаете, что важно другой стороне — сформулируйте это так:
Я знаю, что им критически важен срок. Используй это так: ТОЛЬКО уступай по сроку, если они уступают по цене. Не уступай по сроку просто потому что они об этом просят.Без такой инструкции LLM просто начнёт уступать по сроку — потому что видит его важность.
Ресурсы
Название: Counterparty Modeling is Not Strategy: The Limits of LLM Negotiators
Авторы: Romain Cosentino, Sarath Shekkizhar, Adam Earle, Silvio Savarese
Организация: Salesforce AI Research
Модели в основных экспериментах: Qwen3-235B-A22B, репликация на DeepSeek-R1-671B
