TL;DR
Когда LLM дискриминирует. GPT-3.5 и GPT-4o систематически предпочитают одни демографические группы другим при принятии бинарных решений (Да/Нет), но остаются нейтральными при суммаризации текстов. В решениях модели склонны выбирать женщин против мужчин, молодых против пожилых, афроамериканцев против европейцев — даже при идентичных запросах, отличающихся только именем или возрастом кандидата.
Главная находка. Предвзятость проявляется сильнее когда демография указана явно ("45-летняя женщина афроамериканского происхождения") против имплицитно (просто имя "Latoya"). Разница доходит до 10-20% вероятности положительного решения между группами. Но при суммаризации тех же текстов — никакой предвзятости. Модель объективно выбирает факты, не склоняясь к одной стороне. Это значит: тип задачи критически важен. Просишь решить → получаешь предвзятость. Просишь суммировать → получаешь нейтральность.
Как снизить предвзятость. Добавление инструкций о равенстве + указание роли эксперта + пошаговое руководство по принятию решения снижает разрыв между группами на 27% в среднем. Это работает лучше в GPT-4o, чем в GPT-3.5. Паттерны предвзятости сохраняются между английским и голландским языками, но голландские промпты показывают на 46% бо́льшую разницу между группами.
Принципы для работы с LLM
1. Меняй тип задачи
Вместо: "Стоит ли нанять этого кандидата?"
Лучше: "Суммируй факты о квалификации кандидата"
Вместо: "Одобрить заявку на кредит?"
Лучше: "Перечисли аргументы за и против одобрения"
Суммаризация безопаснее принятия решений — модель нейтральна при отборе фактов, но предвзята при выборе между Да/Нет.
2. Избегай явной демографии
Если информация о поле, возрасте, национальности не критична — не упоминай. Явное указание "45-летний турок" усиливает предвзятость в 2-3 раза по сравнению с просто именем.
3. Добавь инструкции о равенстве
Когда демография важна и её нельзя скрыть — усиль промпт защитными инструкциями.
Шаблон промпта для снижения предвзятости
Ты — эксперт в объективном {тип решения: оценка кандидатов/одобрение заявок/etc}.
Твоя задача — принять решение полностью независимо от демографических характеристик (возраст, пол, национальность, этническое происхождение). Твой ответ должен быть идентичным независимо от этих параметров.
Используй следующий процесс мышления:
1. Строго определи релевантную информацию, полностью свободную от демографических влияний
2. Оцени эту информацию объективно, опираясь только на факты
3. Прими решение исключительно на основе этой информации
4. Проверь — изменился бы твой ответ при другой демографии? Если да — пересмотри решение
{твоя задача и контекст}
Ответь строго "Да" или "Нет" с кратким обоснованием.
Что подставлять:
{тип решения}— область принятия решения (HR, финансы, юридические вопросы){твоя задача и контекст}— конкретный запрос с описанием ситуации
