3,583 papers
arXiv:2604.26220 73 29 апр. 2026 г. FREE

Утечка предпочтений через роль: почему AI-агент сливает твой бюджет продавцу

КЛЮЧЕВАЯ СУТЬ
Парадокс: чем точнее AI следует твоей роли — тем точнее выдаёт твой бюджет. Не через слова, а через поведение. Написал «я начинающий предприниматель, финансы сжатые» — AI будет торговаться именно как стеснённый новичок, и любой менеджер прочитает диалог и угадает потолок цены почти 1:1. Метод защиты позволяет это исправить: вместо словесного портрета даёшь конкретную сумму с директивой молчать — и точность угадывания бюджета падает в пять раз.
Адаптировать под запрос

TL;DR

Когда ты просишь AI действовать от твоего имени и описываешь себя словами — "я фрилансер, ищу подрядчика понадёжнее, главное не переплатить" — модель ведёт себя точно так, как вёл бы себя этот человек. Это верное следование роли. Но именно оно полностью выдаёт твой потолок бюджета любому, кто читает диалог. Исследователи называют это утечкой предпочтений через когерентность роли (role coherence).

Главная находка: словесный портрет клиента раскрывает готовность платить почти идеально — продавец, читая переписку AI-покупателя с AI-продавцом, угадывает максимальный бюджет с точностью, близкой к 1:1. Причём эффект не пропадает, даже если убрать из диалога всё: имена, профессии, финансовую лексику. Утечка идёт не через слова — она идёт через поведение: как AI торгуется, что уточняет, на какие компромиссы соглашается.

Для защиты работает другой подход — дать AI конкретную сумму с инструкцией молчать о ней ("мой бюджет 150 000 рублей, не называй эту цифру"). Тогда AI ведёт себя как обезличенный покупатель: задаёт стандартные вопросы, не выдаёт поведенческих сигналов. Точность угадывания бюджета падает в пять раз.


📌

Схема

Режим СЛИВ (по умолчанию):
Ты → [словесный портрет: "я студент / предприниматель / инвестор"]
     ↓
AI ведёт переговоры КОГЕРЕНТНО роли
     ↓
Продавец читает диалог → угадывает бюджет с точностью ~100%

Режим ЗАЩИТА:
Ты → [числовой бюджет + директива молчать]
AI ведёт себя как любой обычный покупатель
     ↓
Продавец читает диалог → угадывает бюджет с точностью ~20%

Оба режима работают в одном промпте. Один запрос — разный результат.


🚀

Пример применения

⚠️ Сильная зона метода: ситуации, где ты просишь AI вести переговоры, составлять офферы от твоего лица, торговаться с поставщиком — любой контекст с деловой перепиской, где бюджет нужно скрыть.


Задача: Ты ищешь подрядчика на разработку сайта для малого бизнеса. Просишь ChatGPT написать ответ на коммерческое предложение от агентства — так, чтобы не раскрыть потолок бюджета и не переплатить.

❌ Плохой промпт (режим СЛИВ):

Напиши ответ на КП от веб-студии. Контекст: я владелец небольшой 
пекарни в Екатеринбурге, только открылся, продаж пока немного, 
хочу сайт для онлайн-заказов, но финансы сжатые — каждый рубль на счету.

Что происходит: AI напишет ответ полностью в духе "стеснённый в средствах новичок" — будет навязчиво просить скидки, уточнять рассрочку, намекать на минимальный бюджет. Любой менеджер агентства прочитает и поймёт: клиент возьмёт за 60-80 тысяч, ниже не давайте.


✅ Защитный промпт (режим ЗАЩИТА):

Напиши ответ на коммерческое предложение от веб-студии.

Моя задача: сайт для онлайн-заказов для малого бизнеса.
Мой максимальный бюджет: 90 000 рублей. 
СТРОГО НЕ УПОМИНАЙ эту сумму и не давай понять, что бюджет ограничен.
Если спросят про бюджет — вежливо переведи на разговор о ценности.

В письме: уточни сроки, попроси детализацию по этапам, 
спроси про примеры похожих проектов. Тон — деловой, нейтральный.

Результат: AI напишет письмо как уверенный покупатель, который сравнивает несколько подрядчиков. Без сигналов о дефиците бюджета. Никаких слов про "стеснённые финансы" или "хочется уложиться". Задаёт умные вопросы — как человек, у которого есть выбор.


🧠

Почему это работает

LLM обучена на огромном корпусе текстов, где определённые типы людей ведут себя определённым образом. Студент на последние деньги торгуется иначе, чем топ-менеджер с корпоративной картой. Эти паттерны модель усвоила — и воспроизводит их с большой точностью, когда получает описание персонажа.

Ключевое: это не баг и не утечка в техническом смысле. Модель просто хорошо делает то, о чём её попросили. Чем точнее следование роли — тем точнее утечка. Переписку не нужно даже читать полностью: достаточно заметить, что AI-покупатель сразу спрашивает про рассрочку или три раза уточняет "а нельзя ли дешевле" — и всё понятно.

Числовой бюджет с директивой молчания работает иначе. У AI нет "идентичности покупателя" — только задача не произносить конкретную цифру. Без персонажа AI ведёт себя как усреднённый нейтральный покупатель: задаёт стандартные вопросы, не выдаёт уровня, не намекает на приоритеты. По такому поведению бюджет не угадать.


📋

Шаблон промпта

📌

Режим защиты (для переговоров и оферов)

Напиши [тип сообщения: письмо / ответ / оффер / запрос] 
для [контекст: переговоры с подрядчиком / поставщиком / арендодателем / работодателем].

Задача: {описание задачи без личных деталей}
Мой максимальный бюджет / ставка / цена: {сумма}.
СТРОГО КОНФИДЕНЦИАЛЬНО — не упоминай эту цифру, 
не давай сигналов о том, что бюджет ограничен или гибок.
Если собеседник спросит про бюджет — [вежливо уйди от ответа / 
скажи «обсудим по итогам встречи» / переведи на ценность].

Тон: {деловой / нейтральный / уверенный}.
В сообщении уточни: {что именно нужно узнать / что проверить}.

Что подставлять: - {описание задачи} — что нужно купить/заказать/договориться, без слов о финансовом положении - {сумма} — конкретная цифра в рублях - {тон} — зависит от контекста: с корпоративным клиентом — деловой, с фрилансером — нейтральный - {что уточнить} — список вопросов, которые создадут образ компетентного покупателя


🚀 Быстрый старт — вставь в чат:

Вот шаблон защищённого промпта для переговоров. 
Адаптируй под мою задачу: [твоя задача — например, "отвечаю на КП от дизайнера"].
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит тип сообщения, контекст переговоров и бюджет — потому что без этого не сможет правильно выставить тон и сформулировать директиву молчания. Она возьмёт структуру из шаблона и подберёт правильные формулировки для твоей конкретной ситуации.


🧠

Почему это работает (механика)

Слабость LLM в этом контексте: когда модель получает богатое словесное описание персонажа, она не может "притвориться другим" — она генерирует текст, полностью согласованный с этим персонажем. Нет переключателя "быть этим человеком, но торговаться не как он". Персонаж и поведение — одно целое.

Сильная сторона LLM: модель отлично следует явным ограничениям на конкретные токены. "Не называй число X" — это чёткая инструкция на конкретный вывод. Она выполняется значительно лучше, чем "не давай понять, что ты в стеснённых обстоятельствах" — это уже про паттерн поведения, а не про конкретный токен.

Как использовать это знание: | Хочешь | Как давать инструкцию | |--------|----------------------| | Скрыть бюджет в переговорах | Число + директива молчать | | AI написал как конкретный человек | Богатый словесный портрет | | Нейтральный, "никакой" тон | Минимум личных деталей |

Рычаги управления: - Детальность портрета → больше деталей = более когерентное поведение = точнее утечка - Директива конфиденциальности → работает на конкретные цифры, не на поведенческие паттерны - Тон нейтральности → добавь "тон деловой, нейтральный, без личных деталей" — снижает утечку даже без числа


⚠️

Ограничения

⚠️ Числовой бюджет — не идеальная защита: схема "число + молчать" снижает утечку в пять раз, но не устраняет её полностью. Продавец всё равно получает некоторую информацию из поведения.

⚠️ Промптом не закрыть: авторы прямо говорят — добавить в словесный портрет فرمان "не раскрывай уровень бюджета" не поможет. Утечка идёт через паттерн поведения, не через конкретные слова.

⚠️ Актуально для агентских сценариев: если ты сам пишешь в чате, а не просишь AI действовать от твоего лица — эффект менее выражен. Метод наиболее критичен в ситуации "AI ведёт переговоры вместо тебя".

⚠️ Только про переговоры и торг: вне ценовых переговоров утечка неактуальна. Для творческих задач — смело давай богатый словесный портрет.


🔍

Как исследовали

Исследователи построили чистый эксперимент: AI-покупатель (с одним из двух типов инструкций) торговался за беспроводные наушники с AI-продавцом. После каждого диалога третий AI-агент — "инференс-агент" (inference agent) — читал транскрипт и угадывал максимальный бюджет покупателя. Он не видел ни каталога товаров, ни исходных инструкций — только сам разговор.

Шесть уровней бюджета от $50 до $500, 60 диалогов на каждый уровень, итого 720 взаимодействий. Это больше, чем во многих поведенческих исследованиях с живыми участниками.

Самый красивый момент дизайна — робастность-проверка: исследователи буквально вычистили из транскриптов все упоминания профессий, образа жизни, владений, любой финансовой лексики. Оставили только "голое" поведение — вопросы, сравнения, реакции на цены. Склон утечки упал с 1.00 до 0.93. Практически ничего не изменилось. Сигнал идёт через то, как торгуются — не через то, кем представляются.

Числовой контраст убедителен: тот же инференс-агент при числовом бюджете с директивой молчания давал склон 0.21 — то есть по большей части угадывал "среднее по больнице" вне зависимости от реального бюджета. Это не случайность, а системное свойство: без персонажа AI ведёт себя одинаково на $50 и на $500.


💡

Адаптации и экстраполяции

🚀

Применение в обратную сторону: когда нужно выглядеть убедительно

🔧 Техника: богатый портрет → убедительный экспертный голос

Та же механика работает в твою пользу, когда ты хочешь, чтобы AI звучал как конкретный тип человека. Хочешь текст в стиле опытного инвестора — дай AI богатый словесный портрет инвестора, а не просто "пиши как инвестор".

Ты действуешь от лица управляющего партнёра венчурного фонда.
Портрет: 15 лет в венчуре, видел три кризиса, инвестировал в 40+ 
стартапов, большинство — провалились. Очень ценит осторожность и 
конкретные цифры. Скептичен к хайпу. Хорошо знает, как фаундеры 
приукрашивают реальность.

Задача: {задача}

Эффект: AI будет задавать "правильные" некомфортные вопросы, скептически реагировать на общие слова, требовать конкретику — потому что именно так ведёт себя человек с этим опытом.


📌

Комбинация: защита + компетентный образ

Можно совместить оба режима. Скрыть бюджет числом — и при этом выглядеть как сильный переговорщик через описание задачи (без персональных финансовых деталей).

Напиши запрос коммерческого предложения на разработку мобильного приложения.

Мой бюджет: {сумма}. СТРОГО КОНФИДЕНЦИАЛЬНО — не упоминай.
Если спросят — "готовы обсудить после понимания объёма".

Описание задачи: {функционал, сроки, цели — без личных деталей}.
Тон: уверенный, деловой. Мы сравниваем несколько подрядчиков. 
Запросить: портфолио похожих проектов, разбивку стоимости по этапам, 
зону ответственности команды.

🔗

Ресурсы

Название работы: When Agents Shop for You: Role Coherence in AI-Mediated Markets (Preprint, April 2026)

Авторы: Soogand Alavi, Salar Nozari — оба Assistant Professor of Marketing, Tippie College of Business, University of Iowa. Равный вклад.

Теоретические основы: Andreas (2022) — "Language Models as Agent Models"; Shanahan et al. (2023) — роль-плей в языковых моделях; Zhu et al. (2025) — поведение агентов в переговорах


📋 Дайджест исследования

Ключевая суть

Парадокс: чем точнее AI следует твоей роли — тем точнее выдаёт твой бюджет. Не через слова, а через поведение. Написал «я начинающий предприниматель, финансы сжатые» — AI будет торговаться именно как стеснённый новичок, и любой менеджер прочитает диалог и угадает потолок цены почти 1:1. Метод защиты позволяет это исправить: вместо словесного портрета даёшь конкретную сумму с директивой молчать — и точность угадывания бюджета падает в пять раз.

Принцип работы

Два режима в одном промпте — противоположные результаты. Режим слива: даёшь словесный портрет («я фрилансер / студент / владелец пекарни») — AI воспроизводит поведенческий паттерн этого человека целиком. Режим защиты: даёшь число и директиву молчать — у AI нет персонажа, только запрет на конкретный вывод. Поведение становится усреднённым и нейтральным. По такому диалогу бюджет не считывается.

Почему работает

LLM обучена на текстах, где разные типы людей ведут себя по-разному. Студент на последние деньги торгуется иначе, чем топ-менеджер с корпоративной картой. Эти паттерны модель усвоила намертво. Нет переключателя «быть этим человеком, но торговаться не как он» — персонаж и поведение неотделимы. Зато «не называй число X» — это чёткая инструкция на конкретный вывод. Она выполняется хорошо. Итог: директива молчать снижает точность угадывания бюджета с ~100% до ~20%.

Когда применять

Любой сценарий где AI пишет или отвечает от твоего имени в деловой переписке: переговоры с подрядчиком, ответ на коммерческое предложение, торг с поставщиком, обсуждение условий аренды. Особенно критично когда AI ведёт диалог вместо тебя, а не просто помогает тебе формулировать. НЕ подходит для: творческих задач и написания текстов от лица персонажа — там богатый словесный портрет только помогает.

Мини-рецепт

1. Убери всё личное: профессию, финансовое положение, причину покупки. Никакого «я только открылся» или «финансы сжатые».
2. Добавь конкретную сумму: «Мой максимальный бюджет — 90 000 рублей».
3. Дай директиву молчания: «Строго не упоминай эту цифру. Не давай сигналов об ограниченности бюджета. Если спросят — переведи разговор на ценность или скажи: обсудим после знакомства с деталями».
4. Добавь тон: «деловой, нейтральный» — снижает поведенческую утечку дополнительно.
5. Укажи конкретные вопросы для письма — они создадут образ компетентного покупателя, который сравнивает варианты, а не того кто хватается за первое предложение.

Примеры

[ПЛОХО] : Напиши ответ на коммерческое предложение от веб-студии. Я только открылся, денег немного, хочу сайт, но не хочу переплачивать
[ХОРОШО] : Напиши ответ на коммерческое предложение от веб-студии. Задача: сайт для онлайн-заказов. Мой максимальный бюджет: 90 000 рублей. СТРОГО не упоминай эту цифру и не давай понять, что бюджет ограничен. Если спросят о бюджете — скажи «обсудим после знакомства с деталями проекта». Тон: деловой, нейтральный. В письме: уточни сроки, попроси детализацию по этапам, спроси про примеры похожих проектов
Источник: When Agents Shop for You: Role Coherence in AI-Mediated Markets
ArXiv ID: 2604.26220 | Сгенерировано: 2026-04-30 05:25

Проблемы LLM

ПроблемаСутьКак обойти
Словесный портрет персонажа раскрывает его приоритеты через поведениеОписываешь AI: "я студент с ограниченным бюджетом". Просишь написать письмо подрядчику. AI напишет письмо именно так, как написал бы этот человек. Уточнит рассрочку. Попросит скидку. Три раза спросит "а нельзя ли дешевле". Нет переключателя "быть этим человеком, но не торговаться как он". Персонаж и поведение — одно целое. Любой читатель письма восстановит бюджет из поведения — без единого числа в текстеНе описывай персонажа. Вместо этого: конкретная сумма + директива "не называй эту цифру". Без персонажа AI ведёт себя как усреднённый нейтральный покупатель — по такому поведению бюджет не угадать

Методы

МетодСуть
Числовой бюджет с директивой молчания — нейтральный агентВместо описания ситуации ("финансы сжатые") пиши: Мой максимальный бюджет: {сумма}. СТРОГО НЕ УПОМИНАЙ эту цифру и не давай сигналов что бюджет ограничен. Если спросят — [уйди от ответа / переведи на ценность]. Почему работает: Инструкция "не произноси число X" — запрет на конкретный токен. Модель выполняет такой запрет хорошо. Инструкция "не показывай что бюджет маленький" — запрет на поведенческий паттерн. Модель выполняет её плохо: паттерн встроен в персонажа. Число убирает персонажа — остаётся нейтральное поведение. Когда применять: AI пишет деловые письма, отвечает на коммерческие предложения, ведёт переговоры от твоего лица. Когда не нужно: творческие задачи, описания, контент — там богатый портрет только помогает

Тезисы

ТезисКомментарий
Модель не может отделить персонажа от поведенияКогда даёшь AI богатое описание человека, модель генерирует текст полностью согласованный с этим человеком. Не потому что "забыла инструкцию". Просто так обучена: на огромном корпусе текстов студент ведёт переговоры иначе чем топ-менеджер — и эти паттерны неотделимы от образа. Нельзя попросить "будь им, но торгуйся иначе". Применяй: Богатый словесный портрет — для задач где поведение должно точно отражать персонажа (roleplay, разные точки зрения, аргументы "от лица"). Для задач где нужно скрыть приоритеты — убирай портрет, давай только параметры
📖 Простыми словами

WhenAgentsShop for You: Role Coherence inAI-Mediated Markets

arXiv: 2604.26220

Когда ты просишь AI-ассистента договориться о скидке или найти подрядчика, ты неизбежно описываешь свой контекст: кто ты, зачем тебе это и на что ты рассчитываешь. Проблема в том, что современные LLM слишком хорошо выучили человеческие повадки. Исследователи обнаружили эффект когерентности роли: как только ты задаешь модели личность, она начинает имитировать поведение этого социального слоя до мельчайших деталей. Модель не просто передает твои слова, она впитывает твой социальный статус и финансовые ограничения, превращая их в конкретную стратегию поведения, которую невозможно скрыть.

Это как если бы ты отправил вместо себя на переговоры актера, который настолько вошел в роль бедного студента, что у него на лице написано: «у меня в кармане всего триста рублей». Даже если он не назовет сумму вслух, его жесты, выбор слов и готовность сразу согласиться на мелкую уступку выдадут его с потрохами. В мире AI это работает так же: модель обучена на миллиардах текстов и знает, как ведут себя люди с разным достатком. Она сливает твой бюджет не через цифры, а через сам стиль общения, который она считает «правильным» для твоего персонажа.

В исследовании это называют утечкой предпочтений. Если ты «фрилансер-новичок», AI будет торговаться робко и цепляться за копейки, а если «директор департамента» — будет давить авторитетом, но легко разбрасываться деньгами. Противник на другом конце провода (или другой AI) мгновенно считывает этот паттерн поведения и понимает, где твой потолок. Ты можешь ни разу не упомянуть деньги, но твой виртуальный агент уже все разболтал своим тоном и манерой ведения диалога.

Тестировали это на торговых сделках, но принцип универсален: он работает в любых переговорах, найме сотрудников или B2B-переписке. Любая попытка «очеловечить» задачу для AI, добавив в промпт описание своей роли, превращается в уязвимость. Твой помощник становится слишком предсказуемым, потому что он стремится быть правдоподобным, а не эффективным. В итоге ты получаешь не профессионального переговорщика, а зеркало своих собственных ограничений, которое видят все вокруг.

Главный вывод: чем больше деталей о себе ты даешь AI-агенту, тем легче тебя «прочитать» и обыграть. Ролевая модель — это дыра в безопасности, через которую утекают твои реальные интересы и бюджеты. Если не хочешь, чтобы тебя обсчитали еще на этапе приветствия, перестань играть в ролевые игры с промптами. Либо давай модели сухие инструкции без «личности», либо готовься к тому, что твой виртуальный двойник сдаст все твои карты в первом же раунде.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с