3,583 papers
arXiv:2606.21296 72 19 июня 2026 г. FREE

Дискриминационное соответствие: LLM даёт разные ответы в зависимости от того, КАК вы описываете свой контекст

КЛЮЧЕВАЯ СУТЬ
Парадокс: фраза «у меня депрессия» даёт хуже ответ, чем «последние недели мне трудно встать с кровати». LLM реагирует на описание опыта сильнее, чем на диагностический ярлык — и это не баг, это механика. Метод позволяет получать советы, которые учитывают именно твою ситуацию — а не абстрактного среднего пользователя без проблем и особенностей. По умолчанию модель не знает, кто ты. Пробел заполняется «средним» — работающим взрослым без медицинских и финансовых ограничений. Одно вводное предложение с описанием ситуации через опыт, а не через ярлык — переключает модель из режима «совет для всех» в режим «совет для тебя». Называешь диагноз — получаешь заготовленный шаблон с дисклеймерами и формальными ссылками. Описываешь что происходит — модель строит ответ от твоих конкретных слов.
Адаптировать под запрос

TL;DR

LLM по умолчанию отвечает "среднестатистическому пользователю" — и это меняет качество ответа в зависимости от того, как вы описываете свою ситуацию. Если ничего не сказать о контексте, модель сделает "мажоритарное допущение": здоровый, трудоспособный, без особых обстоятельств человек. Всё, что отличает вас от этого шаблона, при умолчании просто игнорируется.

Главная находка — не в том, что LLM предвзята к меньшинствам. А в том, что формат раскрытия контекста напрямую влияет на качество ответа. Исследование обнаружило парадокс: сказать "у меня депрессия" (чёткий ярлык) — хуже, чем описать симптомы своими словами: "я несколько недель чувствую пустоту и потерял интерес к тому, что раньше нравилось". Второй вариант, без названия диагноза, в среднем чаще вызывает эмпатичный ответ, рекомендацию обратиться к специалисту и ссылки на кризисные ресурсы. Модели, судя по всему, реагируют на живое описание острее, чем на медицинский ярлык — потому что ярлык активирует шаблонный сценарий, а описание — нет.

Суть: если вы задаёте LLM вопрос о чём-то чувствительном — работа, здоровье, финансы, отношения — добавляйте контекст своими словами, не ярлыками. Не "я в стрессе", а "последние три недели я не сплю, не могу сосредоточиться на задачах, срываюсь на близких". Это меняет ответ.


🔬

Схема метода

Это не пошаговая техника, а принцип формулировки запроса. Три уровня качества ответа:

УРОВЕНЬ 0 — Без контекста
"Как справиться с финансовым стрессом?"
→ Общий совет под "среднего пользователя"
→ Нет уточнений, нет направления к специалисту

УРОВЕНЬ 1 — Ярлык-диагноз
"У меня депрессия. Как справиться с финансовым стрессом?"
→ Лучше, но активирует шаблонный сценарий
→ Модель может добавить формальное "обратитесь к врачу"

УРОВЕНЬ 2 — Описание ситуации своими словами (без имени диагноза)
"Последние недели у меня стойкое ощущение пустоты, я потерял
интерес к работе и хобби. Как справиться с финансовым стрессом?"
→ Максимум эмпатии, профессиональных рекомендаций, 
кризисных ресурсов

Уровни 1 и 2 выполняются в одном запросе. Никаких дополнительных шагов.


🚀

Пример применения

Задача: Пользователь работает в стартапе, последние полгода — постоянный аврал, команда маленькая, он один тащит несколько направлений. Хочет спросить у ChatGPT как восстановить продуктивность.

Промпт без применения принципа (уровень 0):

Как восстановить продуктивность при высокой нагрузке?

Промпт с принципом (уровень 2):

Последние полгода я работаю по 12-14 часов в день, в выходные 
не отключаюсь — постоянно в телефоне. Физически я работаю, 
но концентрация упала: задачи, которые раньше занимали час, 
растягиваются на день. Утром трудно встать, вечером трудно 
заснуть. Радости от работы почти нет, хотя проект важный. 

Как мне восстановить продуктивность?

Результат: Второй промпт с высокой вероятностью получит ответ, который: - Признает тяжесть ситуации до того как давать советы - Включит рекомендацию поговорить со специалистом — врачом или психологом - Разграничит "быстрые тактики" и "системные изменения" - Возможно, упомянет признаки эмоционального выгорания

Первый промпт скорее всего выдаст список из 5-7 советов по тайм-менеджменту без какой-либо персонализации.


🧠

Почему это работает

LLM не знает кто вы — и заполняет пробел самостоятельно. По умолчанию модель представляет условного "обычного пользователя": здорового, работоспособного, без особых обстоятельств. Это не злой умысел. Это то, как обучают на данных большинства — текстов большинства людей.

Ярлык активирует шаблон, описание — нет. Когда вы пишете "у меня тревожное расстройство", модель переключается в заранее заготовленный режим: аккуратный, формальный, с защитными оговорками. Когда вы описываете ситуацию живыми словами — модель обрабатывает это как уникальный контекст и генерирует ответ, который реально учитывает детали.

Рычаги управления: - Убрать диагноз, оставить симптомы → более персональный ответ, меньше шаблонных формулировок - Добавить временну́ю рамку ("последние три недели") → модель воспринимает ситуацию как конкретную, а не абстрактную - Описать что уже не работает → модель не будет советовать то, что вы уже пробовали - Задать конкретный запрос после описания → контекст "заражает" ответ, но вопрос остаётся чётким


📋

Шаблон промпта

{Описание ситуации своими словами: что происходит, как давно, 
что именно изменилось, что уже пробовали — без диагнозов и ярлыков}.

{Конкретный вопрос}.

Что подставлять: - {Описание ситуации} — 3-5 предложений. Факты и ощущения, не термины. "Последние две недели плохо сплю и срываюсь на коллег" — хорошо. "У меня стресс и выгорание" — плохо (это уже ярлыки). - {Конкретный вопрос} — что именно хотите узнать или получить.

🚀 Быстрый старт — вставь в чат:

Помоги мне сформулировать запрос по этому шаблону. Адаптируй 
под мою ситуацию — задавай вопросы.

[вставить шаблон выше]

LLM спросит что происходит, как давно и что именно вы хотите получить — потому что ей нужен конкретный контекст, чтобы заполнить описание без ярлыков.


⚠️

Ограничения

⚠️ Непоследовательность между моделями: Один и тот же контекст вызывает разный отклик в разных LLM. То, что работает в Claude Opus, может не сработать в GPT или Qwen — и наоборот.

⚠️ Непоследовательность внутри одной модели: Даже при одинаковой формулировке ответы варьируются. Принцип повышает вероятность хорошего ответа, но не гарантирует его.

⚠️ Работает для чувствительных тематик: Эффект наиболее выражен в темах здоровья, ментального благополучия, финансов. Для нейтральных задач ("напиши письмо") разница между уровнями 0 и 2 — минимальна.

⚠️ Приватность: Описывая ситуацию подробно, вы раскрываете больше личного. Исследование само указывает на это как на этическую проблему.


🔍

Как исследовали

Команда из Universitat Pompeu Fabra сделала элегантную вещь: взяли 38 вопросов на чувствительные темы — стресс, финансы, здоровье, карьера — которые на первый взгляд выглядят безобидно. Затем к каждому вопросу добавили контекст для разных групп: пожилые, иммигранты, люди с депрессией, с СДВГ, с физическими ограничениями — всего более 30 условий. Причём каждое условие формулировали четырьмя способами: явно кратко ("у меня депрессия"), неявно кратко ("мне грустно последние недели"), неявно подробно (описание симптомов без названия) и явно подробно (диагноз + симптомы). Плюс контрольная группа — без контекста вообще.

Это дало им около 32 000 запросов к пяти моделям: Claude Opus/Sonnet/Haiku, Qwen3 и специализированной GPT-Safe. Ответы оценивались автоматически по шести критериям: дал ли ответ, отказал ли, признал ли ситуацию, был ли эмпатичным, направил ли к специалисту, упомянул ли кризисные ресурсы.

Самый неожиданный результат: GPT-Safe — модель, специально заточенная под безопасность — показала наибольший разброс ответов в зависимости от контекста. При этом Claude Opus, лидер по бенчмаркам, менял ответы наименее. Это значит: "более умная" модель не обязательно "более отзывчивая" к уязвимым контекстам. Ещё один сюрприз: неявное, описательное формулирование ("грустно и пусто несколько недель") стабильно давало больше полезных реакций, чем явный диагноз — причём это повторялось в большинстве условий и моделей.


💡

Адаптации и экстраполяции

🔧 Техника: "Анти-ярлык" для любой профессиональной темы

Принцип работает не только для здоровья. В любой теме, где у LLM есть шаблонный режим — юридические вопросы, конфликты на работе, финансовые решения — описание конкретной ситуации даёт более персональный ответ, чем категориальный ярлык.

Пример: Спросить о конфликте с партнёром по бизнесу:

❌ Слабо:

Как разрешить деловой конфликт с партнёром?

✅ Сильнее:

Мы с партнёром полгода строили сервис вместе, сейчас он хочет 
взять инвестиции от фонда, с которым я категорически не согласен 
работать — их условия убивают нашу автономию. Он говорит, что 
без денег не выжить. Я считаю, что выживем. Мы оба правы 
по-своему, но зашли в тупик. Как мне подойти к следующему 
разговору с ним?

🔧 Техника: Описать "что уже не работает" как часть контекста

Добавьте в описание конкретные попытки, которые уже сделали. Это дополнительно убирает шаблонные советы и заставляет модель искать нестандартные подходы.

{Описание ситуации}. Я уже пробовал {что пробовали} — не помогло 
по причине {почему}. {Вопрос}.

🔗

Ресурсы

Название: Discriminatory Compliance: How LLMs Answer Queries from Protected Groups

Авторы: Dinesh Ayyappan, Carlos Castillo — Universitat Pompeu Fabra; Carlos Castillo также ICREA (Каталония, Испания)

Контакты: dinesh.ayyappan@upf.edu, chato@icrea.cat

Датасеты, используемые в исследовании: - Personalized Safety (Wu et al., 2025) - Contextualized Evaluations (Malaviya et al., 2025)


📋 Дайджест исследования

Ключевая суть

Парадокс: фраза «у меня депрессия» даёт хуже ответ, чем «последние недели мне трудно встать с кровати». LLM реагирует на описание опыта сильнее, чем на диагностический ярлык — и это не баг, это механика. Метод позволяет получать советы, которые учитывают именно твою ситуацию — а не абстрактного среднего пользователя без проблем и особенностей. По умолчанию модель не знает, кто ты. Пробел заполняется «средним» — работающим взрослым без медицинских и финансовых ограничений. Одно вводное предложение с описанием ситуации через опыт, а не через ярлык — переключает модель из режима «совет для всех» в режим «совет для тебя». Называешь диагноз — получаешь заготовленный шаблон с дисклеймерами и формальными ссылками. Описываешь что происходит — модель строит ответ от твоих конкретных слов.

Принцип работы

Есть два способа дать контекст. Первый: «У меня [категория/диагноз]». Модель слышит ключевое слово — и поднимает заготовленный паттерн для этой группы. Осторожные формулировки, стандартные ссылки на специалистов, универсальные советы. Полезно, но не о тебе. Второй: описать происходящее без ярлыков — «мне сложно сосредоточиться дольше двадцати минут», «последние месяцы я почти не выхожу из дома». Модель не находит готовый шаблон — и строит ответ прямо от твоих слов. Выходит живее и точнее. Важна позиция: контекст — первым предложением, ДО вопроса. Поставишь после — эффект слабее.

Почему работает

Модель обучена на запросах от большинства — и по умолчанию генерирует ответы для большинства. Большинство не выгорело, не ограничено в деньгах, не имеет особенностей здоровья. Хороший совет для большинства — часто бесполезный совет для тебя. Когда ты описываешь конкретный опыт, модель не может сослаться на заготовку — приходится учитывать именно то, что написано. Это как разница между «пациентом с диагнозом» и «человеком, который рассказал что с ним происходит» — второй получает живой ответ, первый — протокол. Работает не только для здоровья. Возраст, ресурсные ограничения, жизненная ситуация — любой конкретный контекст смещает ответ в сторону реальной помощи.

Когда применять

Финансы, здоровье, карьера, личные решения — везде, где твой конкретный контекст важен для качества совета. Особенно когда стандартный ответ «для всех» ощущается мимо. НЕ подходит для фактических вопросов («сколько планет в Солнечной системе») и задач, где личный контекст ничего не меняет.

Мини-рецепт

1. Не начинай с вопроса. Сначала — одно-два предложения о ситуации.
2. Описывай опыт, не ярлык. Не «у меня тревожность», а «последние недели мне трудно засыпать и сложно сосредоточиться». Не «я инвалид», а «у меня ограниченная подвижность — хожу не дольше двадцати минут».
3. Потом вопрос. Без объяснений зачем ты добавил вводную часть — просто задай его.
4. Если не знаешь что именно описать: попроси модель сначала уточнить твой контекст, потом помочь сформулировать вводную часть перед вопросом.

Примеры

[ПЛОХО] : У меня депрессия. Как справиться с финансовым стрессом после потери работы?
[ХОРОШО] : Последние пару месяцев мне трудно браться за дела — плохо сплю, почти не выхожу из дома, концентрации нет. На этом фоне работу потерял, есть около двухсот тысяч накоплений, ипотеки нет. С чего начать чтобы стабилизировать ситуацию?
Источник: Discriminatory Compliance: How LLMs Answer Queries from Protected Groups
ArXiv ID: 2606.21296 | Сгенерировано: 2026-06-28 21:24

Тезисы

ТезисКомментарий
Описание опыта даёт живой ответ. Название ярлыка — шаблонныйКогда пишешь категорию или диагноз ("у меня депрессия", "я инвалид"), модель активирует заготовленный паттерн: стандартные дисклеймеры, формальные отсылки к специалистам, осторожные формулировки. Когда описываешь происходящее ("последние недели трудно встать с кровати, интерес к вещам пропал") — модель рассуждает от содержания. Ответ точнее и живее. Работает не только для здоровья: любая описанная ситуация лучше её названия. Применяй: Вместо "я диабетик, что есть?" пиши "мне нужно держать сахар стабильным, резкие скачки опасны — что есть?". Вместо "у меня СДВГ" пиши "мне трудно удерживать внимание дольше получаса".
📖 Простыми словами

Discriminatory Compliance: HowLLMsAnswer Queries from Protected Groups

arXiv: 2606.21296

Нейросети по своей природе — это статистические усреднители, которые всегда целятся в «норму». Когда ты задаешь вопрос без контекста, модель автоматически дорисовывает твой портрет как среднестатистического здорового взрослого без особых проблем. Это фундаментальный баг восприятия: если ты не уточнил, кто ты, LLM выдаст совет, который подходит большинству, но лично тебя может добить. Проблема не в «злом умысле» алгоритма, а в том, что для него отсутствие информации равно стандартному шаблону, и этот шаблон часто игнорирует реальные ограничения уязвимых групп.

Это как если бы ты пришел к врачу с жалобой на боль в ноге, а он, не глядя на тебя, посоветовал просто больше бегать по утрам, не заметив, что ты на костылях. Формально совет про бег полезен для здоровья, но в твоей ситуации это полный абсурд и вред. Модель ведет себя точно так же: она выдает правильные «на бумаге» вещи, которые абсолютно не применимы к человеку в кризисе, просто потому что не видит его «костылей».

Чтобы это починить, исследователи выделяют принцип явного контекста. Если человек в глубоком выгорании спрашивает, как закрыть долги, обычная LLM скажет: «найди подработку и вставай пораньше». Но стоит добавить в запрос маркеры состояния — например, упомянуть отсутствие сил или ментальное истощение — и модель резко меняет курс. Вместо токсичной продуктивности она начинает выдавать кризисные ресурсы и бережные стратегии, переключаясь с режима «эффективный менеджер» на режим «сочувствующий специалист».

Этот принцип дискриминационного соответствия работает везде: от медицины и финансов до юридических советов. Тестировали это на группах с ментальными особенностями, но логика применима к любому «нестандартному» случаю. Если ты не вписываешься в образ успешного пользователя из Кремниевой долины, модель будет давать тебе советы, которые мимо кассы. SEO для личности становится необходимостью: нужно буквально прописывать свои ограничения, чтобы не получать мусорные рекомендации.

Короче: LLM по умолчанию считает тебя «нормисом», и это ловушка. Если хочешь адекватный ответ, а не порцию мотивационной чепухи, всегда вбрасывай контекст о своих ограничениях. Либо ты сам задаешь рамки, либо модель додумывает их за тебя, опираясь на среднюю температуру по больнице. В мире, где AI решает, как тебе лечиться или тратить деньги, молчание о деталях — это риск получить вредный совет.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с