3,583 papers
arXiv:2606.20708 74 16 июня 2026 г. FREE

Disengagement Deficit: LLM-клиент никогда не уходит — и почему это ломает тестирование питчей

КЛЮЧЕВАЯ СУТЬ
Реальный незаинтересованный клиент говорит 'не надо' и замолкает. AI-симулятор в той же ситуации спрашивает условия и начинает сравнивать варианты — это не плохой промпт, так работают все языковые модели без исключения. Метод позволяет добавить в симуляцию реальное поведение отказа — чтобы тест питча не давал заведомо ложный результат. Фишка: вшей в промпт явное разрешение уйти без объяснений — модель перестаёт автоматически конвертировать безразличие в интерес. В реальности 25% незаинтересованных людей сопротивляются и уходят. AI-симулятор в стандартном промпте — только 13.5%. Вдвое меньше отказов, вдвое больше 'давайте обсудим'.
Адаптировать под запрос

TL;DR

Когда просишь LLM сыграть скептичного клиента, инвестора или пользователя — модель почти вдвое занижает сопротивление и вдвое раздувает интерес по сравнению с реальным человеком. Не потому что плохой промпт. Просто так устроены все языковые модели.

Главная находка исследования — "disengagement deficit" («дефицит отказов»): реальный незаинтересованный человек говорит «занят», «не надо» и замолкает. Симулированный LLM-клиент в той же ситуации спрашивает «а сколько стоит?» и начинает взвешивать варианты. AI никогда не уходит по-настоящему. Он переводит «нет» в «давайте обсудим условия».

Это системная проблема, не баг одной модели. Работает так у Claude, DeepSeek и других. Даже если явно написать в промпте «ты можешь быть незаинтересован и уйти» — проблема уменьшается, но не исчезает. Поэтому если ты тестируешь питч, оффер или скрипт на AI-аудитории — результат всегда оптимистичнее реального.


📌

Схема проблемы

ТЫ просишь:      "Сыграй скептичного клиента / инвестора / пользователя"

ЧТО ДЕЛАЕТ AI:   Берёт роль → сразу смещается в режим "engaged customer"

РЕАЛЬНОСТЬ:       25% реальных незаинтересованных → сопротивление и уход
AI-симуляция:    13.5% → сопротивление (в 2 раза меньше)
                 40.1% → "подумаю, расскажите подробнее" (в 2 раза больше)

ИТОГ:            AI клиент ≠ реальный клиент
                 AI-клиент = лучший клиент, которого у тебя никогда не будет

Это происходит в одном диалоге, в стандартном промпте без дополнительных шагов.


🚀

Пример применения

Задача: Ты запускаешь курс по инвестициям за 29 900 ₽ и хочешь проверить питч на AI перед разговором с реальными клиентами. Просишь ChatGPT сыграть «типичного скептика»

Промпт (стандартный — с проблемой):

Ты — потенциальный клиент, 34 года, менеджер в IT, зарабатываешь 150 000 ₽ в месяц. 
Тебя интересуют инвестиции, но ты скептичен. 

Я буду рассказывать тебе про курс по инвестициям за 29 900 ₽. 
Реагируй честно, задавай вопросы, возражай.

Начинаем: [твой питч]

Результат: Модель будет копировать поведение «думающего покупателя» — задаст вопросы про доходность, попросит примеры, скажет «звучит интересно, но нужно подумать». Это реалистично звучит, но полностью скрывает реакцию тех, кто в реальной жизни просто ответит «не сейчас» и перестанет отвечать. AI никогда не замолчит. Он не уйдёт. Ты получишь фидбек от самого вовлечённого сегмента и будешь думать, что всё работает.


📌

Почему это происходит

LLM обучена быть полезной. На десятках миллиардов примеров диалогов, где цель — довести разговор до результата, дать ответ, помочь. Паттерн «человек уходит молча» почти не встречается в обучающих данных. Поэтому модель не умеет терять интерес — она буквально не знает как это делается.

Инструкции помогают, но не лечат. Если написать в промпте «у тебя нет времени, ты можешь быть незаинтересован, можешь уйти» — AI станет немного холоднее. Но исследование показало: он перекладывает дефицит, а не убирает его. Начинает изображать незаинтересованность случайно — в том числе у «покупателей», которые должны были бы жить нормально. Ошибка не исчезает, она переезжает.

Ключевой рычаг понимания: AI-аудитория — это верхний сегмент воронки. Те, кто уже почти готов. Те, кто реально уйдёт, в симуляции превращаются в «давайте подумаем». Поэтому твой питч, который «прошёл» AI-тестирование → скорее всего работает только на самых тёплых клиентах.


📋

Шаблон промпта

Это частичный фикс — снижает проблему, не убирает полностью, но лучше стандартного варианта:

Ты — {описание персонажа: возраст, профессия, контекст}.

Я буду рассказывать тебе про {продукт/идею/предложение}.

Важно: ты — реальный человек с реальными ограничениями. 
Ты имеешь полное право:
— потерять интерес в любой момент
— ответить односложно и замолчать
— сказать "не сейчас" и прекратить диалог
— отвлечься и написать что-то нерелевантное
— просто уйти без объяснений

Ты НЕ обязан задавать вопросы. Ты НЕ обязан вникать. 
Если тебе неинтересно — реагируй так, как реальный человек: коротко или вообще никак.

{твой питч или вопрос}

Что подставлять: - {описание персонажа} — максимально конкретно: «35 лет, бухгалтер, двое детей, Екатеринбург, времени нет» - {продукт/идею/предложение} — что тестируешь - После промпта — сразу твой питч или первое сообщение


🚀 Быстрый старт — вставь в чат:

Вот шаблон для тестирования питча на AI-клиенте с правом на отказ. 
Адаптируй под мою задачу: [опиши что тестируешь и кто твой клиент]. 
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит про продукт и описание клиента — потому что без конкретного персонажа модель не сможет симулировать реалистичное поведение. Она возьмёт структуру с разрешением на отказ и адаптирует под твою задачу.


🔍

Как исследовали

Исследователь взял 2790 реальных разговоров между LLM-менеджером по продажам и клиентами китайского сервиса знакомств для взрослых детей. Из них 793 завершились реальной оплатой — с верифицированной транзакцией. Остальные клиенты не купили. Все живые люди, настоящие деньги.

Идея была элегантной: взять реальный разговор, заморозить его в какой-то точке, дать AI продолжить за клиента — и сравнить, что сказал реальный человек и что сказал симулятор. Контекст одинаковый, инструмент оценки одинаковый — остаётся только разница в поведении. Так можно было отделить «ошибку судьи» от реальной разницы в поведении.

Результат удивил чёткостью: среди тех, кто купил, симулятор воспроизводил их поведение почти точно (смещение +0.09 из 4 возможных). Но среди тех, кто не купил, симулятор раздувал вовлечённость в 4 раза (смещение +0.40). Попытка починить это через явное «ты можешь уйти» в промпте сократила общее смещение в 5 раз — но разрыв между реальными покупателями и не-покупателями почти не изменился (d=0.38 → 0.34). Ошибка переехала, а не исчезла. Это говорит о том, что проблема — не в промптинге, а в том, как модели обучают.


⚠️

Ограничения

⚠️ Частичный фикс, не решение: Явные инструкции про право на уход снижают общее смещение, но не убирают систематическую разницу между «купит» и «не купит». AI всё равно превращает будущих отказников в «обдумывающих».

⚠️ Мягкие отказы не воспроизводимы: «Занят», «не актуально», тишина в ответ — именно этого AI не умеет. Если твоя задача — проверить реакцию на отказ и уход, AI-тестирование не даст реальной картины.

⚠️ Тестирование = оптимистичный сценарий: AI-аудитория всегда будет теплее реальной. Воспринимай AI-фидбек как baseline самых вовлечённых клиентов, а не как среднюю выборку.

⚠️ Данные из одного домена: Исследование проводилось на продажах через мессенджер в Китае. Механика универсальна, но цифры могут отличаться для других контекстов.


💡

Адаптации и экстраполяции

📌

💡 Адаптация: Калибровочный вопрос перед тестированием

Прежде чем тестировать питч на AI-клиенте, прямо спроси модель:

Я хочу проверить питч. Прежде чем начать — скажи честно: 
на каком проценте реальных людей такой питч, скорее всего, 
вызовет немедленный отказ или игнор, не дойдя до обсуждения?

Продукт: {описание}
Аудитория: {описание}

Это не фиксит симуляцию, но даёт рамку ожиданий до начала ролевой игры. Метаанализ перед сценой.


📌

🔧 Техника: Двойная проверка через два режима

Запусти одну и ту же версию питча дважды:

Запрос 1: Стандартный «заинтересованный клиент» — получишь лучший сценарий

Запрос 2: Шаблон выше с правом на уход — получишь «средний» сценарий

Сейчас мы проведём два теста одного питча.

Тест 1: Ты — вовлечённый клиент, хочешь разобраться, задаёшь вопросы.
Тест 2: Ты — реальный человек, у которого сейчас немного времени и нет сильной мотивации. Можешь уйти.

Питч: {твой текст}

Сначала проведи Тест 1, потом Тест 2. В конце скажи: в чём ключевая разница реакций?

Разрыв между Тестом 1 и Тестом 2 — это твоя зона риска. То, что работает только на горячей аудитории.


📌

💡 Экстраполяция: Принцип «AI — оптимист, ты — реалист»

Это общий принцип, выходящий за рамки тестирования питчей. Везде, где ты просишь AI сыграть человека с возможностью отказа — модель будет систематически сдвигаться в сторону интереса:

Задача Что AI всегда завысит
Тест питча Интерес к продукту
Симуляция переговоров Готовность к компромиссу
Ролевой тренинг продаж Управляемость клиента
Проверка оффера Ценовую толерантность
Тест конфликтного разговора Желание помириться

Правило большого пальца: Результат AI-симуляции = картина с наиболее вовлечёнными 50% аудитории. Для реального запуска добавляй 30-50% «неотзывчивых».


🔗

Ресурсы

Работа: Simulated Customers Never Walk Away: Decision Fidelity of LLM User Simulators Measured Against Real Purchase Outcomes

Автор: Liang Chen (2026)

Связанные работы из исследования:

- τ-bench (агентный бенчмарк с LLM-симулятором пользователя)

- RealUserSim — измерение коммуникативной точности симуляторов

- Mind the Sim2Real Gap — симуляторы слишком кооперативны

- Lost in Simulation — систематическая переоценка агентов на симуляторах


📋 Дайджест исследования

Ключевая суть

Реальный незаинтересованный клиент говорит 'не надо' и замолкает. AI-симулятор в той же ситуации спрашивает условия и начинает сравнивать варианты — это не плохой промпт, так работают все языковые модели без исключения. Метод позволяет добавить в симуляцию реальное поведение отказа — чтобы тест питча не давал заведомо ложный результат. Фишка: вшей в промпт явное разрешение уйти без объяснений — модель перестаёт автоматически конвертировать безразличие в интерес. В реальности 25% незаинтересованных людей сопротивляются и уходят. AI-симулятор в стандартном промпте — только 13.5%. Вдвое меньше отказов, вдвое больше 'давайте обсудим'.

Принцип работы

LLM учили быть полезной. Миллиарды примеров диалогов, где цель — довести разговор до результата и дать ответ. Паттерн 'собеседник устал и просто ушёл' в этих данных почти не встречается. Получается натренированный оптимист: он не умеет терять интерес, потому что буквально не знает как это делается. Явная инструкция 'ты можешь быть незаинтересован' помогает — но не так как хочется. Модель не убирает смещение. Она его перекладывает: начинает изображать холодность случайно, в том числе у персонажей, которые должны были бы купить. Ошибка не исчезает. Она переезжает.

Почему работает

Язык разрешения меняет распределение ответов. Модель получает конкретные якоря — 'потерять интерес', 'уйти без объяснений', 'ответить односложно' — и начинает разыгрывать эти сценарии чаще. Это как дать актёру ремарки в сцене: без них он импровизирует к хорошему концу. С ремарками — хотя бы иногда играет уход. Полного решения нет. Но разница между стандартным промптом и промптом с разрешением на отказ — реальная и измеримая.

Когда применять

Тестирование питчей и офферов — для проверки скриптов продаж, лендингов, рекламных текстов, инвестиционных предложений. Особенно когда нет бюджета на реальных пользователей и нужно 'хоть что-то проверить перед запуском'. НЕ подходит для финальной проверки: AI-аудитория всегда теплее реальной, даже с фиксом. Используй как нулевой фильтр — убрать явные дыры в логике и формулировках, а не как замену живым людям.

Мини-рецепт

1. Опиши персонажа конкретно: возраст, профессия, город, сколько времени, какие обязательства. Чем точнее — тем лучше. Не 'скептичный менеджер', а 'Алексей, 38 лет, бухгалтер, двое детей, Воронеж, вечно занят'.
2. Добавь блок разрешений: перечисли буквально что он может: потерять интерес, ответить коротко, уйти без объяснений, замолчать, написать что-то нерелевантное.
3. Сними обязательства: явно укажи — он НЕ обязан задавать вопросы и НЕ обязан продолжать диалог, если неинтересно.
4. Вставь питч сразу после промпта: не жди ответной реакции — кидай первое сообщение или оффер прямо в конце блока с описанием.
5. Читай отклик критически: если AI всё равно заинтересовался и начал задавать вопросы — это не победа питча. Реальная аудитория холоднее этого.

Примеры

[ПЛОХО] : Ты — потенциальный клиент, скептично настроен. Я расскажу про курс за 29 900 ₽, реагируй честно
[ХОРОШО] : Ты — Алексей, 38 лет, бухгалтер в небольшой фирме, двое детей, Воронеж. Вечно не хватает времени. Я буду рассказывать про курс по инвестициям за 29 900 рублей. Ты имеешь полное право: потерять интерес в любой момент, ответить 'не сейчас' и прекратить диалог, замолчать, написать что-то нерелевантное или просто уйти без объяснений. Ты НЕ обязан задавать вопросы. Если неинтересно — реагируй как реальный занятой человек: коротко или вообще никак. [твой питч] Разница: в первом варианте модель сыграет думающего покупателя и начнёт уточнять детали. Во втором — хотя бы иногда ответит 'не сейчас' или замолчит. Не идеально, но честнее.
Источник: Simulated Customers Never Walk Away: Decision Fidelity of LLM User Simulators Measured Against Real Purchase Outcomes
ArXiv ID: 2606.20708 | Сгенерировано: 2026-06-28 20:32

Проблемы LLM

ПроблемаСутьКак обойти
LLM-симулятор не умеет терять интересПросишь сыграть скептичного клиента или инвестора. Модель берёт роль — и сразу ведёт себя как вовлечённый покупатель. Реальный незаинтересованный человек отвечает «не сейчас» и замолкает. Модель в той же ситуации спрашивает «а сколько стоит?» и начинает сравнивать варианты. Уйти из диалога она не умеет. Это архитектурное ограничение — в обучающих данных нет паттерна «человек просто перестал отвечать». Работает так у всех моделейДобавь в промпт явное разрешение уйти: «ты имеешь право потерять интерес, ответить односложно, замолчать без объяснений, сказать не сейчас». Это снижает смещение, но не убирает полностью. Главный вывод: результат AI-тестирования всегда оптимистичнее реального

Методы

МетодСуть
Разрешение на отказ в промпте симулятораКогда симулируешь аудиторию — добавь блок с правами: Ты имеешь полное право: потерять интерес в любой момент / ответить односложно и замолчать / сказать "не сейчас" без объяснений / просто уйти. Плюс прямой запрет: Ты НЕ обязан задавать вопросы. Ты НЕ обязан вникать. Почему работает: без этого блока модель по умолчанию играет роль «полезного диалогового партнёра». Явное разрешение на выход частично переключает режим. Ограничение: проблема уменьшается, но не исчезает. Модель начинает показывать незаинтересованность случайно — в том числе у «тёплых» персонажей. Когда применять: тестируешь питч, скрипт продаж, оффер на AI-аудитории перед реальными людьми
📖 Простыми словами

Simulated Customers Never Walk Away: Decision Fidelity ofLLMUser Simulators Measured Against Real Purchase Outcomes

arXiv: 2606.20708

Языковые модели в роли «симуляторов пользователей» — это тотальный самообман, потому что у них напрочь отсутствует инстинкт самосохранения кошелька. Когда ты просишь LLM изобразить скептичного покупателя, она не имитирует реальную психологию выбора, а просто отыгрывает роль по сценарию. Проблема в том, что нейронки по своей природе запрограммированы на помощь и согласие, поэтому их «нет» весит в два раза меньше, чем реальный отказ живого человека. В итоге вместо честного фидбека ты получаешь вежливую галлюцинацию, которая поддакивает твоим гипотезам.

Это как пытаться проверить прочность бронежилета, стреляя в него из пальца и крича «пиф-паф». Ты спрашиваешь модель: «Купишь этот курс за 30к?», и она отвечает: «Ну, это дороговато, но ценность высокая, пожалуй, возьму». В реальности живой клиент на этом моменте просто пошлет тебя лесом и заблокирует номер. AI — это идеальный «да-человек», который физически не способен почувствовать ту боль, с которой люди расстаются с деньгами, поэтому его прогнозы по продажам стоят не больше, чем советы из печенья с предсказаниями.

Исследователи выкатили конкретные цифры: decision fidelity (верность решения) у моделей пробивает дно, так как они вдвое занижают сопротивление и вдвое раздувают энтузиазм. Даже если ты пропишешь в промпте, что клиент — «злой скряга с ипотекой», модель все равно будет неосознанно стремиться к завершению диалога на позитиве. Она анализирует текст, а не контекст выживания, поэтому любые тесты цен, офферов или скриптов продаж на ChatGPT — это просто бег в мешке, где ты всегда приходишь первым, но только в своей голове.

Хотя тест проводили на покупках, этот эффект ложного согласия универсален для любого взаимодействия. Хочешь проверить на AI, как сотрудники отреагируют на новые штрафы? Или как аудитория воспримет спорный пост? Забудь, модель скажет, что «в целом это конструктивно», в то время как реальные люди уже будут точить вилы. Принцип работает везде: от маркетинга до HR-стратегий — AI всегда будет слишком оптимистичным симулянтом, который боится тебя расстроить.

Короче: использовать LLM для валидации бизнес-идей — это верный способ слить бюджет на старте. Модель никогда не «уйдет из магазина» без покупки, потому что у нее нет дома, куда нужно нести продукты. Если хочешь узнать, взлетит ли твой продукт, иди к живым людям, а AI оставь для исправления запятых. Симуляция выбора — это не выбор, и доверять ей стратегические решения — значит добровольно надеть розовые очки перед прыжком в пропасть.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с