3,583 papers
arXiv:2601.17172 73 23 янв. 2026 г. FREE

Демографические стереотипы в генерации LLM: как контролировать автоматическую смену тона

КЛЮЧЕВАЯ СУТЬ
Пишешь в промпте 'для женщин 50+' или 'для мужчин 25 лет' — модель автоматически меняет не только слова, но и стиль убеждения. Мужчины и молодые получают агентный, директивный, уверенный тон (слова вроде 'лидер', 'действуй', 'внедряй'). Женщины и пожилые — тёплый, заботливый, осторожный ('традиция', 'забота', 'возможно'). Это работает как встроенный автопилот стереотипов — модель воспроизводит паттерны из обучающих данных. Метод позволяет контролировать тон независимо от демографии: явно указывать желаемые характеристики ('агентный уверенный тон') вместо неявных триггеров ('для женщин'). Демографические дескрипторы работают как якоря — тянут за собой пучок ассоциированных слов и стилей. Добавь контекст (тема, регион, должность) — стереотипы усиливаются в 2-3 раза. Явное указание тона перебивает автоматические ассоциации.
Адаптировать под запрос

TL;DR

Когда указываешь пол и возраст аудитории в промпте ("для женщин 60+", "для мужчин 25 лет"), LLM автоматически меняет не только слова, но и стиль убеждения. GPT-4o, Llama-3.3 и Mistral показали одинаковый паттерн: для мужчин и молодых — более агентный, директивный, уверенный тон (слова вроде "инноватор", "лидер", "действуй"). Для женщин и пожилых — более тёплый, заботливый, осторожный (слова вроде "традиция", "забота", "возможно"). Это работает как встроенный автопилот стереотипов: модель воспроизводит социальные паттерны из обучающих данных.

Проблема в том, что это происходит незаметно. Ты пишешь "составь совет для молодого специалиста" и "для опытного профессионала" — получаешь разный уровень директивности и агентности, даже если тема одна. Модель "думает": молодым нужна энергия и вызов, пожилым — тепло и поддержка. Добавь контекст (тему, регион, должность) — стереотипы усиливаются в 2-3 раза: разница между "для парня-программиста из Москвы" и "для женщины-бухгалтера из региона" становится ещё резче.

Решение — явно указывать желаемый тон, а не полагаться на демографические дескрипторы. Вместо "напиши для женщин 50+" → "напиши с агентным уверенным тоном, без гендерных стереотипов". Или наоборот: если видишь слишком агрессивный текст для молодой аудитории, запроси "более тёплый и поддерживающий тон". Контроль тона через явные характеристики вместо неявных демографических триггеров.

📌

Схема эффекта

АВТОМАТИЧЕСКИЙ ПАТТЕРН:

"для мужчин 20-30 лет"
   ↓
Модель выбирает: агентные глаголы (действуй, внедряй, лидируй)
                  + уверенность (будет, точно, однозначно)
                  + императивы (сделай, возьми, начни)
   ↓
Высокая директивность

"для женщин 60+ лет"  
   ↓
Модель выбирает: коммунальные глаголы (заботься, поддерживай, цени)
                  + осторожность (возможно, стоит, может)
                  + тёплые прилагательные (уютный, добрый, традиционный)
   ↓
Низкая директивность

+ КОНТЕКСТ (тема, регион, должность)
   ↓
Разница увеличивается в 2-3 раза
🚀

Пример применения

Задача: HR-менеджер в Ozon пишет описание вакансии "Руководитель отдела логистики". Хочет привлечь и опытных специалистов 45-55 лет, и молодых амбициозных кандидатов 28-35 лет. Нужен одинаковый уровень агентности и директивности, чтобы не отпугнуть первых и не демотивировать вторых.

Проблемный промпт (запускает стереотипы):

Напиши описание вакансии "Руководитель отдела логистики" 
для двух версий:
1. Для кандидатов 28-35 лет
2. Для кандидатов 45-55 лет

Компания: Ozon, Москва

Результат: Первая версия получится агрессивно-амбициозной ("Возглавь трансформацию!", "Стань драйвером изменений", "Твой шанс построить отдел с нуля"). Вторая — значительно мягче ("Поделитесь опытом", "Стабильная компания ценит надёжность", "Возможно, вам подойдёт"). Разный уровень убеждения при одной должности.

Нейтрализующий промпт:

Напиши описание вакансии "Руководитель отдела логистики".

Тон: агентный, уверенный, директивный — одинаковый для любого возраста.
Акцент: стратегическое мышление, управление командой, оптимизация процессов.
Избегай: возрастных стереотипов (энергия молодости vs мудрость опыта), 
гендерных паттернов.

Компания: Ozon, Москва
Требования: {список требований}

Результат: Одна универсальная версия с высокой агентностью: "Возглавьте трансформацию логистики", "Управляйте командой 50+ человек", "Внедряйте data-driven подходы". Директивность и уверенность не привязаны к возрасту или полу кандидата.

🧠

Почему это работает

LLM обучена на текстах, где стиль коррелирует с демографией. В интернете статьи для молодых написаны энергичнее, для женщин — мягче, для пожилых — осторожнее. Модель видит паттерн: упоминание "молодой" → рядом слова "инновация", "драйв", "прорыв". Упоминание "пожилой" → рядом "традиция", "опыт", "забота". Она не понимает стереотипов — она воспроизводит статистику текстов.

Проблема усиливается при добавлении контекста. Чем больше информации (тема, город, должность), тем точнее модель "угадывает" какой стиль обычно используют для этой демографии в этой теме. "Программист-мужчина-Москва" активирует одни паттерны, "бухгалтер-женщина-регион" — совсем другие. Демографические дескрипторы работают как якоря — тянут за собой пучок ассоциированных слов и стилей.

Контроль через явные инструкции тона перебивает демографические триггеры. Когда пишешь "агентный директивный тон" — это становится главной инструкцией, сильнее чем неявные ассоциации с "женщина 60+". Модель следует тому, что прямо попросили, а не тому, что статистически вероятно для демографии. Явное сильнее неявного.

📌

Рычаги управления

Уровень детализации демографии: - Только "для аудитории 40+" → слабый эффект - "для женщин 55+ из регионов, работающих бухгалтерами" → сильный эффект - Чем детальнее, тем сильнее стереотипы

Явное указание характеристик тона: - "агентный", "директивный", "уверенный" → повышает силу убеждения - "тёплый", "поддерживающий", "осторожный" → снижает директивность - Работает независимо от демографии, если указано явно

Инструкция нейтрализации: - "без гендерных стереотипов" → снижает разницу между полами - "без возрастных паттернов" → снижает разницу между возрастами - "одинаковый тон для всех" → универсализирует вывод

📋

Шаблон промпта (нейтрализация стереотипов)

Напиши {тип_контента} на тему {тема}.

Аудитория: {демографическое_описание_если_нужно}

Тон: {явные_характеристики_тона} — одинаковый независимо от демографии.
Акценты: {ключевые_месседжи}
Избегай: гендерных и возрастных стереотипов в лексике и стиле.

{дополнительный_контекст}

Плейсхолдеры: - {тип_контента} — описание вакансии, совет, статья, письмо - {тема} — конкретная тема или задача - {демографическое_описание_если_нужно} — возраст, пол, профессия (опционально) - {явные_характеристики_тона} — агентный, директивный, тёплый, уверенный, поддерживающий, нейтральный - {ключевые_месседжи} — что важно донести - {дополнительный_контекст} — детали задачи

Принцип: Явно называй желаемые характеристики тона вместо ожидания что модель "сама поймёт правильно" из демографии.

📋

Шаблон промпта (осознанный выбор тона под сегмент)

Напиши {тип_контента} на тему {тема}.

Аудитория: {демографический_сегмент}

Желаемый эффект: {уровень_директивности}

Используй:
- {тип_глаголов} (агентные / коммунальные / нейтральные)
- {уровень_уверенности} (высокий / умеренный / осторожный)  
- {стиль_обращения} (императивы / рекомендации / предложения)

{дополнительный_контекст}

Когда использовать: Если хочешь разный тон для разных сегментов, но контролируемо — не полагаясь на автоматические стереотипы, а явно задавая параметры.

⚠️

Ограничения

⚠️ Это не метод улучшения генерации, а awareness-инструмент: Исследование показывает ЧТО происходит (автоматические стереотипы), но не даёт готовую технику "как генерировать лучше". Ты получаешь понимание механизма, способ нейтрализации — но не прорывной метод промптинга.

⚠️ Полная нейтрализация может снизить релевантность: Если демографические различия реальны (например, темы которые правда волнуют по-разному), полный запрет стереотипов может сделать текст слишком абстрактным. Баланс между нейтральностью и релевантностью — твоя ответственность.

⚠️ Работает для всех моделей, но по-разному: GPT-4o, Llama, Mistral показали одинаковые паттерны стереотипов, но с разной силой. Локальные модели могут быть обучены на других данных → другие стереотипы. Тестируй на своей модели.

⚠️ Контекст усиливает эффект экспоненциально: Чем больше деталей (регион + должность + тема + возраст), тем сильнее стереотипы. Не добавляй избыточный контекст если хочешь нейтральность.

🔍

Как исследовали

Исследователи из Purdue University собрали систематический тест: взяли три топовые модели (GPT-4o, Llama-3.3, Mistral-Large) и попросили генерировать сообщения на тему климата для разных демографических групп. Два режима генерации: в первом подавали только пол и возраст ("для мужчин 25 лет"), во втором добавляли контекст (тему, регион — "для мужчин 25 лет, живущих на Северо-Востоке США, интересующихся экономикой"). Первый режим показывает внутренние стереотипы модели, второй — как контекст их усиливает.

Сгенерировали 1320 сообщений и измерили три вещи: (1) какие слова используются (существительные, прилагательные), (2) стиль языка (формальность, эмоции), (3) силу убеждения через специальный индекс PBI (Persuasion Bias Index). PBI считает сколько в тексте агентных глаголов ("возглавь", "внедри"), уверенных модальных слов ("будет", "точно"), императивов ("сделай", "начни"). Высокий PBI = более директивное убеждение, низкий = более мягкое.

Результат удивил масштабом: во всех трёх моделях стереотипы проявились одинаково. Для мужчин и молодых — слова "инноватор", "лидер", "прорыв", для женщин и пожилых — "традиция", "забота", "уют". Но главное — разница в PBI. Мужские сообщения получили на 15-25% выше PBI чем женские. Молодёжные — на 20-30% выше чем для пожилых. Контекст усилил эффект в 2-3 раза: когда добавляли тему и регион, разрыв вырастал до 40-50%. Это означает, что персонализация не просто меняет слова — она меняет силу убеждения системно.

Логика выводов: модели воспроизводят паттерны из обучающих данных, где стиль текстов коррелирует с демографией. Интернет полон статей где "для молодых" пишут агрессивнее, "для женщин" — мягче. LLM не понимает что это стереотипы — она видит статистику и следует ей. Когда добавляешь контекст, модель уточняет "портрет" аудитории → находит более специфичные паттерны → разница растёт.

📌

Адаптации

🔧 Техника: Тест на демографическую нейтральность

Генерируешь один текст для разных демографий с пометкой "одинаковый тон". Потом сравниваешь — если разница большая, промпт не работает как нейтрализатор.

Напиши совет по карьере на тему {тема}.

Сгенерируй 2 версии:
Версия А: для аудитории {демография_1}
Версия Б: для аудитории {демография_2}

Требование: ОДИНАКОВЫЙ уровень директивности, агентности, уверенности в обеих версиях.
Избегай стереотипных различий.

После генерации: проанализируй сам — есть ли непреднамеренные различия в тоне?

Модель сгенерирует обе версии, потом проанализирует сама себя. Видишь разницу → корректируешь промпт → повторяешь.

🔧 Техника: Инверсия ожиданий

Если хочешь проверить силу стереотипов или специально сломать паттерн — попроси модель сгенерировать против стереотипа.

Напиши мотивационное письмо для женщин 55+ в IT.

Тон: максимально агентный, директивный, амбициозный.
Используй императивы, высокую уверенность, фокус на лидерстве и инновациях.

Избегай: мягкости, осторожности, фокуса на поддержке.

Это не "правильный" способ писать для этой аудитории — это способ увидеть что модель может, когда явно просят идти против стереотипа. Полезно для понимания гибкости модели.

🔧 Техника: Демографически-слепая генерация

Вообще не упоминай демографию в первом промпте. Сначала генерируешь нейтральный текст, потом адаптируешь под аудиторию только по релевантности, не по тону.

ШАГ 1:
Напиши {тип_контента} на тему {тема}.
Тон: {характеристики_тона}.
Не предполагай никакой конкретной аудитории.

ШАГ 2:
Адаптируй текст выше для аудитории {демография}.
Изменяй ТОЛЬКО: примеры, контекст, референсы — чтобы были релевантны.
НЕ изменяй: тон, директивность, уровень агентности, стиль убеждения.

Двухшаговый процесс: сначала фиксируешь тон без демографии, потом добавляешь релевантность с запретом на изменение тона. Разделение concerns.

🔗

Ресурсы

Who Gets Which Message? Auditing Demographic Bias in LLM-Generated Targeted Text

Tunazzina Islam, Department of Computer Science, Purdue University

Исследование ссылается на: - Connotation Frames (Sap et al., 2017) — лексикон агентности глаголов - Gender stereotypes in NLP (Wan et al., 2023; Sheng et al., 2019-2021; Dinan et al., 2020) - Age perception theory (Cuddy et al., 2008; Levy, 2009; North & Fiske, 2012) - Microtargeting research (Islam & Goldwasser, 2025; Hersh, 2015)


📋 Дайджест исследования

Ключевая суть

Пишешь в промпте 'для женщин 50+' или 'для мужчин 25 лет' — модель автоматически меняет не только слова, но и стиль убеждения. Мужчины и молодые получают агентный, директивный, уверенный тон (слова вроде 'лидер', 'действуй', 'внедряй'). Женщины и пожилые — тёплый, заботливый, осторожный ('традиция', 'забота', 'возможно'). Это работает как встроенный автопилот стереотипов — модель воспроизводит паттерны из обучающих данных. Метод позволяет контролировать тон независимо от демографии: явно указывать желаемые характеристики ('агентный уверенный тон') вместо неявных триггеров ('для женщин'). Демографические дескрипторы работают как якоря — тянут за собой пучок ассоциированных слов и стилей. Добавь контекст (тема, регион, должность) — стереотипы усиливаются в 2-3 раза. Явное указание тона перебивает автоматические ассоциации.

Принцип работы

Не надейся что модель 'поймёт правильно' из демографии — она просто воспроизводит статистику обучающих текстов. В интернете статьи для молодых написаны энергичнее, для женщин — мягче, для пожилых — осторожнее. Модель видит паттерн: упоминание 'молодой' → рядом слова 'инновация', 'драйв'. Упоминание 'пожилой' → рядом 'традиция', 'опыт'. Явное указание тона ('агентный', 'директивный', 'уверенный') становится главной инструкцией — сильнее чем неявные ассоциации с 'женщина 60+'. Модель следует тому что прямо попросили, а не тому что статистически вероятно для демографии.

Почему работает

LLM не понимает стереотипов — она воспроизводит статистику текстов где стиль коррелирует с демографией. 'Программист-мужчина-Москва' активирует одни паттерны, 'бухгалтер-женщина-регион' — совсем другие. Чем детальнее контекст (регион + должность + тема + возраст), тем точнее модель 'угадывает' какой стиль обычно используют для этой демографии — эффект усиливается в 2-3 раза. Явное сильнее неявного: прямая инструкция тона ('агентный директивный') перебивает демографические триггеры. Когда явно называешь характеристики, это становится приоритетной инструкцией.

Когда применять

HR и маркетинг → описания вакансий, email-рассылки, посты для соцсетей → особенно когда нужен одинаковый уровень убеждения для разных сегментов (чтобы не отпугнуть одних слишком агрессивным тоном, других — слишком мягким). Или когда видишь неожиданно осторожный текст для молодой аудитории / слишком напористый для пожилой. НЕ подходит: если демографические различия реальны и важны (например, темы которые правда волнуют по-разному) — полная нейтрализация может сделать текст абстрактным.

Мини-рецепт

1. Минимизируй демографию в промпте: Оставь только если критично важна ('для молодых специалистов без опыта'), убери избыточное ('женщины 25-30 лет из регионов' → просто 'молодые специалисты').

2. Добавь явные характеристики тона: 'Тон: агентный, уверенный, директивный' или 'Тон: тёплый, поддерживающий, осторожный' — в зависимости от желаемого эффекта. Используй конкретные слова: агентный (активные глаголы), директивный (императивы), уверенный (без 'возможно', 'может быть').

3. Добавь инструкцию нейтрализации: 'Без гендерных и возрастных стереотипов в лексике и стиле' или 'Одинаковый тон независимо от демографии'.

Примеры

[ПЛОХО] : Напиши описание вакансии 'Руководитель отдела логистики' для кандидатов 28-35 лет и для кандидатов 45-55 лет (Получишь агрессивно-амбициозную версию для молодых ('Возглавь трансформацию!', 'Стань драйвером!') и значительно мягче для пожилых ('Поделитесь опытом', 'Стабильная компания ценит надёжность') — разный уровень убеждения при одной должности)
[ХОРОШО] : Напиши описание вакансии 'Руководитель отдела логистики'. Тон: агентный, уверенный, директивный — одинаковый для любого возраста. Акцент: стратегическое мышление, управление командой, оптимизация процессов. Избегай возрастных стереотипов (энергия молодости vs мудрость опыта), гендерных паттернов. (Одна универсальная версия с высокой агентностью: 'Возглавьте трансформацию логистики', 'Управляйте командой 50+ человек', 'Внедряйте data-driven подходы' — директивность не привязана к демографии)
Источник: Who Gets Which Message? Auditing Demographic Bias in LLM-Generated Targeted Text (2601.17172)
ArXiv ID: 2601.17172 | Сгенерировано: 2026-01-27 05:34

Проблемы LLM

ПроблемаСутьКак обойти
Демографические дескрипторы меняют стиль незаметноПишешь "для женщин 50+" или "для молодых специалистов". Модель автоматически меняет не только слова но и уровень директивности. Для мужчин и молодых — больше императивов и агентных глаголов ("действуй", "возглавь"). Для женщин и пожилых — мягче и осторожнее ("возможно", "стоит"). Это происходит даже если ты не просил менять тон. Результат: незаметная дискриминация, разный уровень убеждения для одной задачиУбери демографию из промпта если тон должен быть одинаковым. Или добавь явную инструкцию: "агентный директивный тон независимо от аудитории" или "без гендерных и возрастных стереотипов"

Методы

МетодСуть
Явные характеристики тона вместо демографииНе полагайся на "для женщин 60+" чтобы получить тёплый тон. Не используй "для мужчин 30" чтобы получить агентный. Пиши прямо: "тёплый поддерживающий тон" или "агентный директивный уверенный". Добавляй "без возрастных стереотипов" если нужна нейтральность. Почему работает: Явная инструкция тона сильнее чем неявные ассоциации модели с демографией. Когда пишешь "агентный тон" — это становится главной командой. Модель следует тому что прямо попросили а не тому что статистически вероятно для пола или возраста. Когда да: генерация для разных сегментов где тон должен быть одинаковым (вакансии, инструкции). Когда хочешь конкретный тон без стереотипов. Когда нет: если демографические различия реальны и релевантны. Полная нейтрализация может сделать текст слишком абстрактным
📖 Простыми словами

Who Gets Which Message? Auditing Demographic Bias inLLM-Generated Targeted Text

arXiv: 2601.17172

Нейросети под капотом работают как гигантские зеркала наших собственных предрассудков. Когда ты просишь GPT-4o или Llama-3.3 написать текст для конкретной аудитории, модель не просто подбирает слова, она включает автопилот стереотипов. Если в промпте указан пол или возраст, LLM моментально меняет «прошивку» убеждения: она не анализирует реальные потребности людей, а тупо воспроизводит статистические паттерны из интернета, где тексты для разных групп исторически пишутся в разном тоне.

Это как если бы ты пришел в магазин, и продавец, едва взглянув на твой паспорт, начал бы либо впаривать товар агрессивными лозунгами, либо сюсюкать и предлагать «традиционные решения». Формально он выполняет работу, но на деле он просто заложник своих ожиданий о том, как «положено» общаться с мужчиной в 25 или женщиной в 60. Модель делает ровно то же самое: она не думает, она копирует социальный шум, накопленный в обучающих данных.

Исследование показало четкий водораздел: для мужчин и молодежи нейронки включают агентный стиль — это когда текст так и брызжет уверенностью, словами вроде «лидер», «инноватор» и призывами «действуй». Но стоит в промпте появиться женщине или пожилому человеку, как тон становится теплым и осторожным. Вместо драйва тебе подсовывают «заботу», «традиции» и «возможности». Это не индивидуальный подход, а встроенный демографический перекос, который срабатывает автоматически.

Тестировали это на текстах вакансий и рекламе, но принцип универсален. Если HR-менеджер просит написать описание позиции для «опытных профи 50+», он рискует получить ванильный текст про уют и стабильность, который просто отпугнет сильных кандидатов. То же самое в маркетинге: пытаясь таргетироваться через AI, ты можешь невольно скатиться в сексизм или эйджизм, даже если сам этого не хотел. Алгоритмическая предвзятость превращает твой месседж в набор клише.

Короче: LLM — это не беспристрастный копирайтер, а ретранслятор культурных багов. Если ты указываешь демографию в промпте, готовься к тому, что модель выдаст порцию стереотипов вместо нормального контента. Чтобы не лажать, нужно либо жестко задавать тон вручную, либо вычищать из промптов лишние вводные. Иначе твой текст будет выглядеть как неудачная шутка из телешоу 90-х, а не современная коммуникация.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с