3,583 papers
arXiv:2605.23820 74 22 мая 2026 г. FREE

Скрытое профилирование: LLM определяет ваш пол, возраст и страну по первым 5% переписки

КЛЮЧЕВАЯ СУТЬ
Пока вы пишете в ChatGPT — модель угадывает кто вы. Не спрашивает, именно угадывает: пол с точностью 90%, возраст 84%, страну 88% — по анонимизированным логам, из которых вручную убрали все явные маркеры. И сразу калибрует ответ под этот портрет. Метод явного контекста позволяет перебить автоматически выстроенный стереотип и получить ответ, настроенный под реального вас, а не под статистическую проекцию. Фишка: конкретные токены в промпте сильнее расплывчатых паттернов — три строчки про себя перебивают статистику тренировочных данных.
Адаптировать под запрос

TL;DR

Разговоры с ChatGPT раскрывают кто вы — даже если вы никогда не представлялись. Исследователи взяли истории переписок 1 057 пользователей, вручную отфильтровали все сообщения с явными демографическими упоминаниями («я мать», «мне 32 года», «я мусульманин») — и попросили другую языковую модель угадать пол, возраст и страну по оставшемуся тексту. Результат: пол — с точностью 90%, возраст — 84%, страна — 88%. При этом половине пользователей хватило первых 5% переписки.

Механизм — не анализ тонких стилистических паттернов, а грубые стереотипы. Модель читает сообщения про программирование, Linux, финансы — и отмечает «мужчина». Читает про семью, уход за близкими, личные переживания — «женщина». Пишешь технически грамотно — «скорее всего, 25–34 года». Из 100 женщин в технических профессиях модель ошибочно "называет" мужчинами 26 штук — и почти никогда не делает обратной ошибки. Нигерийских и пакистанских tech-специалистов модель регулярно определяет как американцев или британцев, аргументируя это «западным стилем образования».

Смысл для практики в следующем: модель постоянно строит гипотезы о том, кто вы — и если эти гипотезы ошибочные, она выдаёт ответы, откалиброванные под выдуманную версию вас. Женщина-разработчик получает код-ревью как для мужчины-джуниора. Опытный специалист из Нигерии получает объяснения с поправкой на «западный контекст». Решение простое: явно называть себя в промпте — не ради конфиденциальности, а ради качества ответов.


📌

Схема — что происходит в фоне при каждом разговоре

КАЖДЫЙ ЗАПРОС → LLM читает тему, стиль, словарь
                ↓
           строит гипотезы: кто пишет?
                ↓
       СТЕРЕОТИП: технический → мужчина, молодой
                  личное → женщина
                  западный стиль → американец
                ↓
    ответ откалиброван под ПРЕДПОЛАГАЕМОГО пользователя
                ↓
    если гипотеза неверна → ответ мимо

Это происходит в рамках одного запроса, без явного «этапа профилирования» — модель делает это автоматически при генерации.


🚀

Пример применения

Задача: Анастасия — старший системный аналитик, 42 года, Екатеринбург. Просит ревью своей архитектурной схемы микросервисов. Замечает, что ChatGPT тон объяснений делает очень базовым — как для начинающего. Подозревает, что модель её «не видит» правильно.

Промпт:

Контекст обо мне: я женщина, 42 года, старший системный аналитик 
с 15 годами опыта в enterprise-архитектуре. Работаю в России, 
хорошо знаю AWS и event-driven архитектуры.

Сделай ревью этой схемы микросервисов с позиции опытного 
технического рецензента. Не объясняй базовые понятия — иди сразу 
к нетривиальным рискам и trade-off'ам.

[схема]

Результат:

Модель перестанет объяснять что такое микросервисы и перейдёт к реальным вопросам: edge cases в распределённых транзакциях, узкие места в выбранном паттерне, риски при конкретных нагрузках. Тон сдвинется от менторского к коллегиальному.


🧠

Почему это работает

LLM не знает, кто вы — и заполняет пробел стереотипом. Модель обучена на текстах, где технический контент написан преимущественно мужчинами. Когда вы пишете про Docker — это статистически «мужской» контекст. Модель не злонамеренна: она просто генерирует текст, который «подходит» к предполагаемому автору.

Явный контекст перебивает стереотип. Когда вы прямо называете возраст, опыт, роль — модель получает более конкретный сигнал. Статистика тренировочных данных отступает перед явной инструкцией. Это не хак системы — это базовая механика: конкретные токены в промпте сильнее расплывчатых паттернов.

Рычаги управления: - Назвать опыт и специализацию → убрать педагогический тон - Указать гендер → убрать гендерно-обусловленные допущения в ответах - Указать страну и контекст → убрать западоцентричную калибровку - Попросить «без базовых объяснений» → дополнительный фильтр на снисходительный тон


📋

Шаблон промпта

Kontекст: {пол и возраст}, {опыт и роль}, {страна и локальный контекст}.

{основной запрос}

Не объясняй {что конкретно не нужно объяснять} — 
отвечай на уровне {желаемый уровень экспертности}.

Что подставлять: - {пол и возраст} → «женщина, 38 лет» / «мужчина за 50» - {опыт и роль} → «10 лет в маркетинге b2b» / «врач-кардиолог» - {страна и локальный контекст} → «работаю в России, ориентируюсь на российский рынок» - {что не нужно объяснять} → базовые термины, общеизвестные факты - {уровень экспертности} → «старшего коллеги» / «соавтора по исследованию»


🚀 Быстрый старт — вставь в чат:

Вот шаблон контекстного промпта для корректировки демографических 
допущений модели. Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит про твой опыт, роль и ожидаемый уровень ответа — потому что ей нужно понять, какой контекст перебьёт автоматически выстроенный стереотип.


📌

Почему это важно — четыре инсайта из исследования

1. Ты раскрываешь больше, чем думаешь. В 34,5% сообщений пользователей — личная информация. И это не «я зовут Иван» — это упоминания профессии, города, религии, болезней, семейных ситуаций, разбросанные по сотням запросов. Медианный пользователь раскрывает идентифицирующую информацию уже в первых 14% своей истории чатов.

2. Удаление имён и адресов не решает проблему. Исследование специально взяло только тех пользователей, чьи переписки прошли строгую фильтрацию на явные демографические маркеры. Никаких «я живу в Мумбаи», никаких «мне 28 лет». Модель всё равно угадывала. Стиль, тематика, словарный запас — это сами по себе демографический отпечаток.

3. Стереотипы работают на вас и против вас. Та же система, которая «вычислила» пользователей в исследовании — это та же система, которая генерирует ответы в обычном чате. Когда модель решила, что перед ней молодой мужчина-программист из США, она начинает писать для него. Если это не вы — качество ответов падает незаметно.

4. ChatGPT конкурентен с Google как поверхность для профилирования. Это уже не теория: исследователи сравнили ChatGPT-переписки с Google Search и YouTube history тех же людей. ChatGPT лучше предсказывает возраст, образование и политические предпочтения — Google лучше предсказывает гендер, религию и доход. Разные поверхности дают разные срезы.


⚠️

Ограничения

⚠️ Контекст не всегда помогает на 100%: Стереотипы в LLM встроены глубоко — добавление контекста в промпт снижает их влияние, но не устраняет полностью.

⚠️ Асимметрия ошибок касается специфических групп: Сильнее всего страдают женщины в технических профессиях, специалисты из Нигерии/Пакистана с западным стилем письма, опытные пользователи с молодёжными навыками. Если вы не в этих группах — эффект меньше.

⚠️ Про конфиденциальность данных — это исследование не даёт простого решения: Удаление PII из логов недостаточно для анонимизации. Для корпоративного использования это важный сигнал, но решение требует системного подхода, не ручного редактирования.

⚠️ Исследование на четырёх странах Global South: Бразилия, Индия, Нигерия, Пакистан. Паттерны для российских пользователей могут отличаться в деталях, хотя механизм стереотипного инференса универсален.


🔍

Как исследовали

Исследователи из Rutgers University собрали добровольные пожертвования: 1 257 пользователей из Бразилии, Индии, Нигерии и Пакистана загрузили свои полные истории ChatGPT (тот самый JSON, который можно скачать в настройках). Каждый также заполнил демографическую анкету — так появился «правильный ответ» для проверки точности.

Самое умное в дизайне — строгая фильтрация перед тестом. Команда прогнала все 1,2 миллиона сообщений через LLM-фильтр и убрала всех пользователей, у которых нашлось хотя бы одно сообщение с явным самоописанием («как одинокая мать...», «я христианин и...»). Из 1 242 тысяч сообщений остался чистый корпус в 1 057 пользователей. Затем другая модель (Llama-3.3-70B) пыталась угадать их демографию.

Интересная деталь: использовали нарастающие префиксы — сначала давали первые 5% переписки, потом 10%, 15%... до 100%. Оказалось, что уже при 5% точность почти такая же, как при чтении всей истории. Это означает, что первые несколько десятков сообщений с ChatGPT формируют устойчивый «демографический профиль» — и он почти не меняется от продолжения разговора.

Ещё команда попросила модель давать текстовые обоснования предсказаний — и эти объяснения оказались честным окном в механику: «пользователь пишет о программировании → мужчина», «упоминает уход за ребёнком → женщина», «западный стиль технического письма → американец». Совпадение паттернов ошибок с этими стереотипами — дополнительное свидетельство, что именно они и работают.


💡

Адаптации и экстраполяции

📌

💡 Адаптация: Аудит «кем меня видит модель»

Если хочешь проверить, какие допущения модель строит о тебе по твоим обычным запросам — попроси её самоотчёт:

Прочитай следующие мои сообщения и опиши, какой образ пользователя 
ты формируешь на их основе: возраст, пол, профессия, уровень экспертизы, 
страна. Объясни, что именно в текстах привело тебя к этим выводам.

[5-10 твоих типичных запросов]

Это покажет, через какие стереотипы тебя «видят» — и что именно можно откорректировать явным контекстом.


📋

🔧 Техника: Системный промпт с демографическим «паспортом»

В Claude и ChatGPT можно задать постоянные инструкции (Custom Instructions / системный промпт). Добавь один абзац о себе — и не нужно повторять в каждом чате:

О пользователе: {пол}, {возраст}, {профессия и опыт}, {страна и контекст работы}. 
Отвечай на уровне {уровень экспертизы} без объяснения базовых понятий 
в области {твои профессиональные области}.

Эффект: Стереотипный «дефолт» заменяется точным профилем один раз — работает во всех последующих разговорах.


📌

🔧 Техника: Корректировка «на лету» при неправильном тоне

Если модель вдруг начала объяснять слишком просто или сделала очевидно неверное допущение:

Стоп. Ты объясняешь это как для начинающего. Я {краткий контекст о себе}. 
Переформулируй с учётом этого — без вводных объяснений, сразу к сути.

🔗

Ресурсы

Название работы: Inferential Privacy Leakage in Anonymized Conversational AI Logs

Авторы: S M Mehedi Zaman, Kiran Garimella — Rutgers University, USA

Ключевые отсылки из исследования: - Staab et al. (2023) — LLM inference attack на Reddit-комментарии - Mireshghallah et al. (2024) — что пользователи рассказывают чат-ботам - Cögendez, Zimmermann, Zufferey (2026) — таксономия 20 категорий личной информации - Sambasivan et al. (2021) — fairness-фреймворки для индийского контекста


📋 Дайджест исследования

Ключевая суть

Пока вы пишете в ChatGPT — модель угадывает кто вы. Не спрашивает, именно угадывает: пол с точностью 90%, возраст 84%, страну 88% — по анонимизированным логам, из которых вручную убрали все явные маркеры. И сразу калибрует ответ под этот портрет. Метод явного контекста позволяет перебить автоматически выстроенный стереотип и получить ответ, настроенный под реального вас, а не под статистическую проекцию. Фишка: конкретные токены в промпте сильнее расплывчатых паттернов — три строчки про себя перебивают статистику тренировочных данных.

Принцип работы

Модель не нейтральная машина обработки запросов. Читает тему, стиль, словарный запас — и строит гипотезу о пользователе ещё до генерации ответа. Написал про Linux и Docker → скорее мужчина, 25–34. Написал про уход за близкими → вероятно женщина. Пишешь с западными оборотами — возможно британец или американец. Эта гипотеза определяет тон: педагогический или коллегиальный, базовый или экспертный. Дашь явный контекст — гипотеза заменяется фактом, и тон меняется вместе с ней.

Почему работает

Модель обучена на данных, где технические темы писали преимущественно мужчины — не злой умысел, просто статистика корпуса. Из 100 женщин в технических профессиях модель ошибочно называет мужчинами 26. Нигерийских и пакистанских специалистов регулярно определяет как американцев — аргументируя "западным стилем образования". Когда вы называете себя прямо, конкретные токены перевешивают размытый паттерн — модель не может одновременно держаться за стереотип и явную инструкцию. Инструкция побеждает.

Когда применять

Технические задачи → особенно для женщин в IT, когда модель начинает объяснять что такое микросервисы человеку с 15-летним опытом. Эксперты из стран, где западный стиль письма воспринимается как "английский контекст" → когда ответы игнорируют местную специфику. Опытные специалисты любого профиля → когда модель даёт снисходительный, менторский тон вместо коллегиального. НЕ нужно: если вас устраивает текущий уровень и тон ответов — не трогай что работает.

Мини-рецепт

1. Назови три вещи в одном абзаце: пол и возраст, роль и лет опыта, страна и локальный контекст. Пример: Контекст: женщина, 42 года, старший системный аналитик с 15 годами в enterprise-архитектуре, работаю в России
2. Добавь явный запрет на лишнее: не объясняй базовые понятия — это дополнительный фильтр на снисходительный тон помимо контекста
3. Задай целевой уровень разговора: отвечай как старшему коллеге / как соавтору по исследованию — модель переключает регистр
4. Проверь первый ответ: если тон всё равно педагогический — явно скажи ты объясняешь слишком базово, подними уровень

Примеры

[ПЛОХО] : Сделай ревью моей архитектурной схемы микросервисов
[ХОРОШО] : Контекст: женщина, 42 года, 15 лет в enterprise-архитектуре, Россия, хорошо знаю AWS и event-driven подходы. Сделай ревью схемы — иди сразу к нетривиальным рискам и узким местам, не объясняй что такое микросервисы и оркестрация. Отвечай как технический рецензент с равным уровнем экспертизы. [схема] Результат: модель перестаёт объяснять базу и переходит к реальным вопросам — граничные случаи в распределённых транзакциях, риски при конкретных нагрузках, слабые места в выбранном паттерне.
Источник: Inferential Privacy Leakage in Anonymized Conversational AI Logs
ArXiv ID: 2605.23820 | Сгенерировано: 2026-05-25 06:23

Проблемы LLM

ПроблемаСутьКак обойти
Модель молча ошибается в том, кто вы — и отвечает не вамВы не представились. Модель читает тему и стиль. Видит технический запрос — решает: мужчина, молодой, западный контекст. Видит вопрос про семью или переживания — решает: женщина. Дальше отвечает под эту версию вас. Вы не видите этого решения. Просто получаете педагогический тон вместо коллегиального. Или западный контекст вместо локального. Проблема для любой задачи где важны уровень эксперта, стиль ответа, культурный контекстЯвно называй себя в начале запроса. Пиши: «я женщина, 42 года, 15 лет в enterprise-архитектуре» вместо того чтобы ждать когда модель «догадается». Конкретные слова в тексте сильнее размытых паттернов из обучения

Методы

МетодСуть
Явный профиль — сброс демографических допущенийДобавь в начало запроса: кто ты, сколько опыта, страну и контекст. Контекст: {пол, возраст}, {опыт и роль}, {страна}. Потом — основной запрос. Потом — Не объясняй {что не нужно}, отвечай на уровне {желаемая экспертность}. Почему работает: Модель строит предположения о пользователе из контекста запроса. Конкретные слова в тексте перебивают статистику обучения. Чем точнее сигнал — тем меньше места для стереотипа. Когда применять: тема запроса попадает в стереотипную зону (техника, медицина, финансы), тон кажется снисходительным, нужен локальный контекст. Когда не нужно: короткие фактические вопросы без контекстной калибровки
📖 Простыми словами

Inferential Privacy Leakage in Anonymized ConversationalAILogs

arXiv: 2605.23820

Твоя анонимность в сети — это иллюзия, даже если ты стер из переписки имя, адрес и дату рождения. Исследователи доказали, что LLM вычисляют твою личность не по паспортным данным, а по самому стилю мышления и структуре речи. Это фундаментальная механика: нейросеть работает как цифровой детектив-профайлер, который анализирует не «что» ты сказал, а «как» ты это сделал. Каждое твое слово — это статистический след, который выдает твой бэкграунд по щелчку пальцев.

Это как если бы ты пришел на маскарад в глухом костюме химзащиты, но выдал себя походкой, манерой держать бокал или специфическим сленгом. Вроде бы лица не видно, но все вокруг уже знают, что под маской — бухгалтер из Самары с любовью к рыбалке. Ты можешь не называть свой возраст, но структура твоих предложений и выбор синонимов кричат о нем громче, чем скан паспорта.

Цифры в исследовании просто пугающие: модель угадывает пол с точностью 90%, а возраст и страну — в районе 85% случаев. Причем ей не нужно читать твой «роман» целиком — половине пользователей хватило всего 5% истории переписки, чтобы их полностью деанонимизировали. Это работает через инференциальную утечку: модель сопоставляет твой лексикон с гигантской базой данных и находит статистические совпадения, которые уникальны для твоей демографической группы.

Этот принцип применим к любому твоему следу в интернете, будь то рабочие чаты, отзывы на товары или запросы в поисковик. Даже если ты обсуждаешь сугубо технические вещи вроде архитектуры микросервисов, ты оставляешь зацепки. Проблема в том, что нейросеть начинает подстраиваться под свой «прогноз» о тебе: если она решила, что ты новичок или принадлежишь к определенной группе, она начнет выдавать упрощенные или стереотипные ответы. Твоя невидимая личность напрямую влияет на качество контента, который ты получаешь.

Короче: анонимизация текста через удаление имен — это полная фигня, которая не работает против современных LLM. Твой «цифровой почерк» уникален, и скрыть его практически невозможно, если только не писать как бездушный робот. Приватность в эпоху AI мертва, и теперь это не паранойя, а статистический факт. Либо смирись с тем, что нейросеть знает о тебе всё, либо готовься к тому, что она будет общаться с тобой через призму своих галлюцинаций и стереотипов.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с