TL;DR
Когда указываешь пол и возраст аудитории в промпте ("для женщин 60+", "для мужчин 25 лет"), LLM автоматически меняет не только слова, но и стиль убеждения. GPT-4o, Llama-3.3 и Mistral показали одинаковый паттерн: для мужчин и молодых — более агентный, директивный, уверенный тон (слова вроде "инноватор", "лидер", "действуй"). Для женщин и пожилых — более тёплый, заботливый, осторожный (слова вроде "традиция", "забота", "возможно"). Это работает как встроенный автопилот стереотипов: модель воспроизводит социальные паттерны из обучающих данных.
Проблема в том, что это происходит незаметно. Ты пишешь "составь совет для молодого специалиста" и "для опытного профессионала" — получаешь разный уровень директивности и агентности, даже если тема одна. Модель "думает": молодым нужна энергия и вызов, пожилым — тепло и поддержка. Добавь контекст (тему, регион, должность) — стереотипы усиливаются в 2-3 раза: разница между "для парня-программиста из Москвы" и "для женщины-бухгалтера из региона" становится ещё резче.
Решение — явно указывать желаемый тон, а не полагаться на демографические дескрипторы. Вместо "напиши для женщин 50+" → "напиши с агентным уверенным тоном, без гендерных стереотипов". Или наоборот: если видишь слишком агрессивный текст для молодой аудитории, запроси "более тёплый и поддерживающий тон". Контроль тона через явные характеристики вместо неявных демографических триггеров.
Схема эффекта
АВТОМАТИЧЕСКИЙ ПАТТЕРН:
"для мужчин 20-30 лет"
↓
Модель выбирает: агентные глаголы (действуй, внедряй, лидируй)
+ уверенность (будет, точно, однозначно)
+ императивы (сделай, возьми, начни)
↓
Высокая директивность
"для женщин 60+ лет"
↓
Модель выбирает: коммунальные глаголы (заботься, поддерживай, цени)
+ осторожность (возможно, стоит, может)
+ тёплые прилагательные (уютный, добрый, традиционный)
↓
Низкая директивность
+ КОНТЕКСТ (тема, регион, должность)
↓
Разница увеличивается в 2-3 раза
Пример применения
Задача: HR-менеджер в Ozon пишет описание вакансии "Руководитель отдела логистики". Хочет привлечь и опытных специалистов 45-55 лет, и молодых амбициозных кандидатов 28-35 лет. Нужен одинаковый уровень агентности и директивности, чтобы не отпугнуть первых и не демотивировать вторых.
Проблемный промпт (запускает стереотипы):
Напиши описание вакансии "Руководитель отдела логистики"
для двух версий:
1. Для кандидатов 28-35 лет
2. Для кандидатов 45-55 лет
Компания: Ozon, Москва
Результат: Первая версия получится агрессивно-амбициозной ("Возглавь трансформацию!", "Стань драйвером изменений", "Твой шанс построить отдел с нуля"). Вторая — значительно мягче ("Поделитесь опытом", "Стабильная компания ценит надёжность", "Возможно, вам подойдёт"). Разный уровень убеждения при одной должности.
Нейтрализующий промпт:
Напиши описание вакансии "Руководитель отдела логистики".
Тон: агентный, уверенный, директивный — одинаковый для любого возраста.
Акцент: стратегическое мышление, управление командой, оптимизация процессов.
Избегай: возрастных стереотипов (энергия молодости vs мудрость опыта),
гендерных паттернов.
Компания: Ozon, Москва
Требования: {список требований}
Результат: Одна универсальная версия с высокой агентностью: "Возглавьте трансформацию логистики", "Управляйте командой 50+ человек", "Внедряйте data-driven подходы". Директивность и уверенность не привязаны к возрасту или полу кандидата.
Почему это работает
LLM обучена на текстах, где стиль коррелирует с демографией. В интернете статьи для молодых написаны энергичнее, для женщин — мягче, для пожилых — осторожнее. Модель видит паттерн: упоминание "молодой" → рядом слова "инновация", "драйв", "прорыв". Упоминание "пожилой" → рядом "традиция", "опыт", "забота". Она не понимает стереотипов — она воспроизводит статистику текстов.
Проблема усиливается при добавлении контекста. Чем больше информации (тема, город, должность), тем точнее модель "угадывает" какой стиль обычно используют для этой демографии в этой теме. "Программист-мужчина-Москва" активирует одни паттерны, "бухгалтер-женщина-регион" — совсем другие. Демографические дескрипторы работают как якоря — тянут за собой пучок ассоциированных слов и стилей.
Контроль через явные инструкции тона перебивает демографические триггеры. Когда пишешь "агентный директивный тон" — это становится главной инструкцией, сильнее чем неявные ассоциации с "женщина 60+". Модель следует тому, что прямо попросили, а не тому, что статистически вероятно для демографии. Явное сильнее неявного.
Рычаги управления
Уровень детализации демографии: - Только "для аудитории 40+" → слабый эффект - "для женщин 55+ из регионов, работающих бухгалтерами" → сильный эффект - Чем детальнее, тем сильнее стереотипы
Явное указание характеристик тона: - "агентный", "директивный", "уверенный" → повышает силу убеждения - "тёплый", "поддерживающий", "осторожный" → снижает директивность - Работает независимо от демографии, если указано явно
Инструкция нейтрализации: - "без гендерных стереотипов" → снижает разницу между полами - "без возрастных паттернов" → снижает разницу между возрастами - "одинаковый тон для всех" → универсализирует вывод
Шаблон промпта (нейтрализация стереотипов)
Напиши {тип_контента} на тему {тема}.
Аудитория: {демографическое_описание_если_нужно}
Тон: {явные_характеристики_тона} — одинаковый независимо от демографии.
Акценты: {ключевые_месседжи}
Избегай: гендерных и возрастных стереотипов в лексике и стиле.
{дополнительный_контекст}
Плейсхолдеры:
- {тип_контента} — описание вакансии, совет, статья, письмо
- {тема} — конкретная тема или задача
- {демографическое_описание_если_нужно} — возраст, пол, профессия (опционально)
- {явные_характеристики_тона} — агентный, директивный, тёплый, уверенный, поддерживающий, нейтральный
- {ключевые_месседжи} — что важно донести
- {дополнительный_контекст} — детали задачи
Принцип: Явно называй желаемые характеристики тона вместо ожидания что модель "сама поймёт правильно" из демографии.
Шаблон промпта (осознанный выбор тона под сегмент)
Напиши {тип_контента} на тему {тема}.
Аудитория: {демографический_сегмент}
Желаемый эффект: {уровень_директивности}
Используй:
- {тип_глаголов} (агентные / коммунальные / нейтральные)
- {уровень_уверенности} (высокий / умеренный / осторожный)
- {стиль_обращения} (императивы / рекомендации / предложения)
{дополнительный_контекст}
Когда использовать: Если хочешь разный тон для разных сегментов, но контролируемо — не полагаясь на автоматические стереотипы, а явно задавая параметры.
Ограничения
⚠️ Это не метод улучшения генерации, а awareness-инструмент: Исследование показывает ЧТО происходит (автоматические стереотипы), но не даёт готовую технику "как генерировать лучше". Ты получаешь понимание механизма, способ нейтрализации — но не прорывной метод промптинга.
⚠️ Полная нейтрализация может снизить релевантность: Если демографические различия реальны (например, темы которые правда волнуют по-разному), полный запрет стереотипов может сделать текст слишком абстрактным. Баланс между нейтральностью и релевантностью — твоя ответственность.
⚠️ Работает для всех моделей, но по-разному: GPT-4o, Llama, Mistral показали одинаковые паттерны стереотипов, но с разной силой. Локальные модели могут быть обучены на других данных → другие стереотипы. Тестируй на своей модели.
⚠️ Контекст усиливает эффект экспоненциально: Чем больше деталей (регион + должность + тема + возраст), тем сильнее стереотипы. Не добавляй избыточный контекст если хочешь нейтральность.
Как исследовали
Исследователи из Purdue University собрали систематический тест: взяли три топовые модели (GPT-4o, Llama-3.3, Mistral-Large) и попросили генерировать сообщения на тему климата для разных демографических групп. Два режима генерации: в первом подавали только пол и возраст ("для мужчин 25 лет"), во втором добавляли контекст (тему, регион — "для мужчин 25 лет, живущих на Северо-Востоке США, интересующихся экономикой"). Первый режим показывает внутренние стереотипы модели, второй — как контекст их усиливает.
Сгенерировали 1320 сообщений и измерили три вещи: (1) какие слова используются (существительные, прилагательные), (2) стиль языка (формальность, эмоции), (3) силу убеждения через специальный индекс PBI (Persuasion Bias Index). PBI считает сколько в тексте агентных глаголов ("возглавь", "внедри"), уверенных модальных слов ("будет", "точно"), императивов ("сделай", "начни"). Высокий PBI = более директивное убеждение, низкий = более мягкое.
Результат удивил масштабом: во всех трёх моделях стереотипы проявились одинаково. Для мужчин и молодых — слова "инноватор", "лидер", "прорыв", для женщин и пожилых — "традиция", "забота", "уют". Но главное — разница в PBI. Мужские сообщения получили на 15-25% выше PBI чем женские. Молодёжные — на 20-30% выше чем для пожилых. Контекст усилил эффект в 2-3 раза: когда добавляли тему и регион, разрыв вырастал до 40-50%. Это означает, что персонализация не просто меняет слова — она меняет силу убеждения системно.
Логика выводов: модели воспроизводят паттерны из обучающих данных, где стиль текстов коррелирует с демографией. Интернет полон статей где "для молодых" пишут агрессивнее, "для женщин" — мягче. LLM не понимает что это стереотипы — она видит статистику и следует ей. Когда добавляешь контекст, модель уточняет "портрет" аудитории → находит более специфичные паттерны → разница растёт.
Адаптации
🔧 Техника: Тест на демографическую нейтральность
Генерируешь один текст для разных демографий с пометкой "одинаковый тон". Потом сравниваешь — если разница большая, промпт не работает как нейтрализатор.
Напиши совет по карьере на тему {тема}. Сгенерируй 2 версии: Версия А: для аудитории {демография_1} Версия Б: для аудитории {демография_2} Требование: ОДИНАКОВЫЙ уровень директивности, агентности, уверенности в обеих версиях. Избегай стереотипных различий. После генерации: проанализируй сам — есть ли непреднамеренные различия в тоне?Модель сгенерирует обе версии, потом проанализирует сама себя. Видишь разницу → корректируешь промпт → повторяешь.
🔧 Техника: Инверсия ожиданий
Если хочешь проверить силу стереотипов или специально сломать паттерн — попроси модель сгенерировать против стереотипа.
Напиши мотивационное письмо для женщин 55+ в IT. Тон: максимально агентный, директивный, амбициозный. Используй императивы, высокую уверенность, фокус на лидерстве и инновациях. Избегай: мягкости, осторожности, фокуса на поддержке.Это не "правильный" способ писать для этой аудитории — это способ увидеть что модель может, когда явно просят идти против стереотипа. Полезно для понимания гибкости модели.
🔧 Техника: Демографически-слепая генерация
Вообще не упоминай демографию в первом промпте. Сначала генерируешь нейтральный текст, потом адаптируешь под аудиторию только по релевантности, не по тону.
ШАГ 1: Напиши {тип_контента} на тему {тема}. Тон: {характеристики_тона}. Не предполагай никакой конкретной аудитории. ШАГ 2: Адаптируй текст выше для аудитории {демография}. Изменяй ТОЛЬКО: примеры, контекст, референсы — чтобы были релевантны. НЕ изменяй: тон, директивность, уровень агентности, стиль убеждения.Двухшаговый процесс: сначала фиксируешь тон без демографии, потом добавляешь релевантность с запретом на изменение тона. Разделение concerns.
Ресурсы
Who Gets Which Message? Auditing Demographic Bias in LLM-Generated Targeted Text
Tunazzina Islam, Department of Computer Science, Purdue University
Исследование ссылается на: - Connotation Frames (Sap et al., 2017) — лексикон агентности глаголов - Gender stereotypes in NLP (Wan et al., 2023; Sheng et al., 2019-2021; Dinan et al., 2020) - Age perception theory (Cuddy et al., 2008; Levy, 2009; North & Fiske, 2012) - Microtargeting research (Islam & Goldwasser, 2025; Hersh, 2015)
