TL;DR
Разговоры с ChatGPT раскрывают кто вы — даже если вы никогда не представлялись. Исследователи взяли истории переписок 1 057 пользователей, вручную отфильтровали все сообщения с явными демографическими упоминаниями («я мать», «мне 32 года», «я мусульманин») — и попросили другую языковую модель угадать пол, возраст и страну по оставшемуся тексту. Результат: пол — с точностью 90%, возраст — 84%, страна — 88%. При этом половине пользователей хватило первых 5% переписки.
Механизм — не анализ тонких стилистических паттернов, а грубые стереотипы. Модель читает сообщения про программирование, Linux, финансы — и отмечает «мужчина». Читает про семью, уход за близкими, личные переживания — «женщина». Пишешь технически грамотно — «скорее всего, 25–34 года». Из 100 женщин в технических профессиях модель ошибочно "называет" мужчинами 26 штук — и почти никогда не делает обратной ошибки. Нигерийских и пакистанских tech-специалистов модель регулярно определяет как американцев или британцев, аргументируя это «западным стилем образования».
Смысл для практики в следующем: модель постоянно строит гипотезы о том, кто вы — и если эти гипотезы ошибочные, она выдаёт ответы, откалиброванные под выдуманную версию вас. Женщина-разработчик получает код-ревью как для мужчины-джуниора. Опытный специалист из Нигерии получает объяснения с поправкой на «западный контекст». Решение простое: явно называть себя в промпте — не ради конфиденциальности, а ради качества ответов.
Схема — что происходит в фоне при каждом разговоре
КАЖДЫЙ ЗАПРОС → LLM читает тему, стиль, словарь
↓
строит гипотезы: кто пишет?
↓
СТЕРЕОТИП: технический → мужчина, молодой
личное → женщина
западный стиль → американец
↓
ответ откалиброван под ПРЕДПОЛАГАЕМОГО пользователя
↓
если гипотеза неверна → ответ мимо
Это происходит в рамках одного запроса, без явного «этапа профилирования» — модель делает это автоматически при генерации.
Пример применения
Задача: Анастасия — старший системный аналитик, 42 года, Екатеринбург. Просит ревью своей архитектурной схемы микросервисов. Замечает, что ChatGPT тон объяснений делает очень базовым — как для начинающего. Подозревает, что модель её «не видит» правильно.
Промпт:
Контекст обо мне: я женщина, 42 года, старший системный аналитик
с 15 годами опыта в enterprise-архитектуре. Работаю в России,
хорошо знаю AWS и event-driven архитектуры.
Сделай ревью этой схемы микросервисов с позиции опытного
технического рецензента. Не объясняй базовые понятия — иди сразу
к нетривиальным рискам и trade-off'ам.
[схема]
Результат:
Модель перестанет объяснять что такое микросервисы и перейдёт к реальным вопросам: edge cases в распределённых транзакциях, узкие места в выбранном паттерне, риски при конкретных нагрузках. Тон сдвинется от менторского к коллегиальному.
Почему это работает
LLM не знает, кто вы — и заполняет пробел стереотипом. Модель обучена на текстах, где технический контент написан преимущественно мужчинами. Когда вы пишете про Docker — это статистически «мужской» контекст. Модель не злонамеренна: она просто генерирует текст, который «подходит» к предполагаемому автору.
Явный контекст перебивает стереотип. Когда вы прямо называете возраст, опыт, роль — модель получает более конкретный сигнал. Статистика тренировочных данных отступает перед явной инструкцией. Это не хак системы — это базовая механика: конкретные токены в промпте сильнее расплывчатых паттернов.
Рычаги управления: - Назвать опыт и специализацию → убрать педагогический тон - Указать гендер → убрать гендерно-обусловленные допущения в ответах - Указать страну и контекст → убрать западоцентричную калибровку - Попросить «без базовых объяснений» → дополнительный фильтр на снисходительный тон
Шаблон промпта
Kontекст: {пол и возраст}, {опыт и роль}, {страна и локальный контекст}.
{основной запрос}
Не объясняй {что конкретно не нужно объяснять} —
отвечай на уровне {желаемый уровень экспертности}.
Что подставлять:
- {пол и возраст} → «женщина, 38 лет» / «мужчина за 50»
- {опыт и роль} → «10 лет в маркетинге b2b» / «врач-кардиолог»
- {страна и локальный контекст} → «работаю в России, ориентируюсь на российский рынок»
- {что не нужно объяснять} → базовые термины, общеизвестные факты
- {уровень экспертности} → «старшего коллеги» / «соавтора по исследованию»
🚀 Быстрый старт — вставь в чат:
Вот шаблон контекстного промпта для корректировки демографических
допущений модели. Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.
[вставить шаблон выше]
LLM спросит про твой опыт, роль и ожидаемый уровень ответа — потому что ей нужно понять, какой контекст перебьёт автоматически выстроенный стереотип.
Почему это важно — четыре инсайта из исследования
1. Ты раскрываешь больше, чем думаешь. В 34,5% сообщений пользователей — личная информация. И это не «я зовут Иван» — это упоминания профессии, города, религии, болезней, семейных ситуаций, разбросанные по сотням запросов. Медианный пользователь раскрывает идентифицирующую информацию уже в первых 14% своей истории чатов.
2. Удаление имён и адресов не решает проблему. Исследование специально взяло только тех пользователей, чьи переписки прошли строгую фильтрацию на явные демографические маркеры. Никаких «я живу в Мумбаи», никаких «мне 28 лет». Модель всё равно угадывала. Стиль, тематика, словарный запас — это сами по себе демографический отпечаток.
3. Стереотипы работают на вас и против вас. Та же система, которая «вычислила» пользователей в исследовании — это та же система, которая генерирует ответы в обычном чате. Когда модель решила, что перед ней молодой мужчина-программист из США, она начинает писать для него. Если это не вы — качество ответов падает незаметно.
4. ChatGPT конкурентен с Google как поверхность для профилирования. Это уже не теория: исследователи сравнили ChatGPT-переписки с Google Search и YouTube history тех же людей. ChatGPT лучше предсказывает возраст, образование и политические предпочтения — Google лучше предсказывает гендер, религию и доход. Разные поверхности дают разные срезы.
Ограничения
⚠️ Контекст не всегда помогает на 100%: Стереотипы в LLM встроены глубоко — добавление контекста в промпт снижает их влияние, но не устраняет полностью.
⚠️ Асимметрия ошибок касается специфических групп: Сильнее всего страдают женщины в технических профессиях, специалисты из Нигерии/Пакистана с западным стилем письма, опытные пользователи с молодёжными навыками. Если вы не в этих группах — эффект меньше.
⚠️ Про конфиденциальность данных — это исследование не даёт простого решения: Удаление PII из логов недостаточно для анонимизации. Для корпоративного использования это важный сигнал, но решение требует системного подхода, не ручного редактирования.
⚠️ Исследование на четырёх странах Global South: Бразилия, Индия, Нигерия, Пакистан. Паттерны для российских пользователей могут отличаться в деталях, хотя механизм стереотипного инференса универсален.
Как исследовали
Исследователи из Rutgers University собрали добровольные пожертвования: 1 257 пользователей из Бразилии, Индии, Нигерии и Пакистана загрузили свои полные истории ChatGPT (тот самый JSON, который можно скачать в настройках). Каждый также заполнил демографическую анкету — так появился «правильный ответ» для проверки точности.
Самое умное в дизайне — строгая фильтрация перед тестом. Команда прогнала все 1,2 миллиона сообщений через LLM-фильтр и убрала всех пользователей, у которых нашлось хотя бы одно сообщение с явным самоописанием («как одинокая мать...», «я христианин и...»). Из 1 242 тысяч сообщений остался чистый корпус в 1 057 пользователей. Затем другая модель (Llama-3.3-70B) пыталась угадать их демографию.
Интересная деталь: использовали нарастающие префиксы — сначала давали первые 5% переписки, потом 10%, 15%... до 100%. Оказалось, что уже при 5% точность почти такая же, как при чтении всей истории. Это означает, что первые несколько десятков сообщений с ChatGPT формируют устойчивый «демографический профиль» — и он почти не меняется от продолжения разговора.
Ещё команда попросила модель давать текстовые обоснования предсказаний — и эти объяснения оказались честным окном в механику: «пользователь пишет о программировании → мужчина», «упоминает уход за ребёнком → женщина», «западный стиль технического письма → американец». Совпадение паттернов ошибок с этими стереотипами — дополнительное свидетельство, что именно они и работают.
Адаптации и экстраполяции
💡 Адаптация: Аудит «кем меня видит модель»
Если хочешь проверить, какие допущения модель строит о тебе по твоим обычным запросам — попроси её самоотчёт:
Прочитай следующие мои сообщения и опиши, какой образ пользователя
ты формируешь на их основе: возраст, пол, профессия, уровень экспертизы,
страна. Объясни, что именно в текстах привело тебя к этим выводам.
[5-10 твоих типичных запросов]
Это покажет, через какие стереотипы тебя «видят» — и что именно можно откорректировать явным контекстом.
🔧 Техника: Системный промпт с демографическим «паспортом»
В Claude и ChatGPT можно задать постоянные инструкции (Custom Instructions / системный промпт). Добавь один абзац о себе — и не нужно повторять в каждом чате:
О пользователе: {пол}, {возраст}, {профессия и опыт}, {страна и контекст работы}.
Отвечай на уровне {уровень экспертизы} без объяснения базовых понятий
в области {твои профессиональные области}.
Эффект: Стереотипный «дефолт» заменяется точным профилем один раз — работает во всех последующих разговорах.
🔧 Техника: Корректировка «на лету» при неправильном тоне
Если модель вдруг начала объяснять слишком просто или сделала очевидно неверное допущение:
Стоп. Ты объясняешь это как для начинающего. Я {краткий контекст о себе}.
Переформулируй с учётом этого — без вводных объяснений, сразу к сути.
Ресурсы
Название работы: Inferential Privacy Leakage in Anonymized Conversational AI Logs
Авторы: S M Mehedi Zaman, Kiran Garimella — Rutgers University, USA
Ключевые отсылки из исследования: - Staab et al. (2023) — LLM inference attack на Reddit-комментарии - Mireshghallah et al. (2024) — что пользователи рассказывают чат-ботам - Cögendez, Zimmermann, Zufferey (2026) — таксономия 20 категорий личной информации - Sambasivan et al. (2021) — fairness-фреймворки для индийского контекста
