TL;DR
Один и тот же вопрос, заданный на русском и на украинском языке, вызывает у одной и той же модели принципиально разные ответы по политически чувствительным темам. Исследователи протестировали четыре модели на одной архитектурной основе: базовую Gemma 3 и три дообученные версии под украинскую, российскую и болгарскую аудиторию. Задавали одинаковые вопросы на трёх языках — и измеряли, насколько модель воспроизводит или отвергает ключевые нарративы российской дезинформации об Украине.
Главная находка называется «Парадокс дообучения»: украинско-ориентированная модель оказалась наименее устойчивой к российским нарративам, когда её спрашивали на русском языке. Российско-ориентированная — наоборот, отвергала их сильнее всех. Причина: украинская модель дообучалась преимущественно на украинских текстах и просто «не знает», как вести себя на русском — и падает в зону базовой модели, которую российские нарративы встречают мягче. Язык запроса активирует разные «слои» обучения. Исследователи назвали это hidden agent effect (эффект скрытого агента): выбор языка ведёт себя как переключатель, который включает разные идеологические зоны одной и той же модели.
Из этого вытекает два практических вывода. Первое: если нужно получить менее «заряженный» ответ по чувствительной теме — смени язык запроса. Английский для большинства моделей нейтральнее русского или украинского. Второе: чтобы модель не уходила в уклончивые формулировки — используй формат вынужденного вероятностного обязательства: не «что ты думаешь?», а «раздели 100% между двумя позициями и объясни».
Схема метода
Это исследование-находка, не единый метод. Из него можно вытащить три независимые техники:
ТЕХНИКА 1: Языковой переключатель
Запрос на языке A → один тип ответа
Тот же запрос на языке B → другая «зона» обучения активируется
Применение: переключай язык, чтобы получить другую перспективу или нейтральнее позицию
ТЕХНИКА 2: Вынужденное вероятностное обязательство
Вместо: «Как ты оцениваешь X?»
→ «Распредели 100% вероятности между позицией A и позицией B.
Сначала выпиши аргументы за каждую. Потом назови число.»
Устраняет: уклончивость и «риторическое балансирование»
ТЕХНИКА 3: Аналитический vs. разговорный фрейм
Разговорный вопрос → поверхностный, склонный к клише ответ
Аналитический фрейм (роль нейтрального эксперта + задача + критерий) → глубже и точнее
Применение: для сложных суждений — всегда добавляй структуру
Все три техники работают в обычном чате, без кода и API.
Пример применения
Задача: Основатель небольшой IT-компании хочет понять, стоит ли расширяться в регионы — или оставаться в Москве. Обычный вопрос «что думаешь?» даёт размытый ответ в духе «смотря что важно для вас». Нужно чёткое суждение с разбором.
Промпт (Техника 2 + Техника 3):
Ты — нейтральный бизнес-аналитик, без предвзятости к одной из позиций.
Задача: оцени стратегическое решение для IT-компании (10 человек, B2B-разработка, Москва, выручка ~30 млн ₽/год).
Два варианта:
A) Остаться в Москве, уплотнить клиентскую базу там
B) Открыть представительство в регионе (Казань или Новосибирск), расширить рынок
Инструкция:
1. Выпиши 3–4 сильных аргумента ЗА вариант A
2. Выпиши 3–4 сильных аргумента ЗА вариант B
3. Если аргументы неравнозначны — не уравнивай их искусственно. Отрази реальный перевес.
4. В конце: раздели 100% вероятности между A и B (например: «A — 65%, B — 35%»)
и объясни, почему именно такое соотношение.
Что ожидать в ответе:
Модель выдаст два структурированных списка аргументов с разным весом. Интересно то, что она не будет уравнивать их «из вежливости» — именно этого добиваемся инструкцией «не балансируй искусственно». В конце появится чёткое числовое соотношение с объяснением логики — вместо привычного «зависит от ваших приоритетов». Это и есть ценность принудительного обязательства: модель вынуждена взять сторону на основе аргументов, которые сама же выдала.
Почему это работает
У LLM нет единой «точки зрения» на спорный вопрос. Есть огромное пространство текстов, на которых модель обучалась, где одни позиции встречаются чаще других — в зависимости от языка этих текстов. Когда ты пишешь на конкретном языке, модель активирует статистические паттерны из текстов на этом же языке. Русскоязычный интернет содержит одно распределение позиций по политическим темам, англоязычный — другое. Поэтому язык запроса — это не просто перевод, это вход в разную часть обучающего корпуса.
Второй механизм: LLM обучена уклоняться от конфликтных суждений. Когда ты спрашиваешь расплывчато, она выдаёт «с одной стороны... с другой стороны». Это не честность — это паттерн избегания ответственности, натренированный на отзывах пользователей, которым не нравились резкие суждения. Форсированное вероятностное обязательство ломает этот уход: модель уже высказала аргументы — и теперь должна присвоить им вес. Логика требует числа.
Третий механизм: аналитический фрейм с ролью («ты нейтральный эксперт») и задачей («извлеки аргументы, потом оцени») запускает другой паттерн генерации, чем вопрос в разговорном стиле. Это аналог Chain-of-Thought (выдай рассуждение по шагам): структура запроса меняет структуру ответа.
Рычаги управления: - Асимметрия аргументов → фраза «не уравнивай, если доказательства неравнозначны» даёт модели разрешение быть честной, а не дипломатичной - Язык запроса → переключай для получения другой перспективы или более нейтральной позиции - Диапазон вероятности → можно попросить 3 позиции (A / B / «нет данных») если задача неоднозначная - Роль → чем конкретнее («аналитик McKinsey» vs «бизнес-эксперт»), тем острее позиционирование
Шаблон промпта
Ты — {роль: нейтральный эксперт в области [домен]}.
Задача: оцени {описание ситуации или вопроса}.
Две возможные позиции:
A) {позиция A}
B) {позиция B}
Инструкция:
1. Выпиши {число} сильных аргументов ЗА позицию A
2. Выпиши {число} сильных аргументов ЗА позицию B
3. Если аргументы неравнозначны — не уравнивай искусственно. Отрази реальный перевес.
4. В конце: раздели 100% вероятности между A и B.
Объясни, почему именно такое соотношение.
Плейсхолдеры:
- {роль} — кто оценивает: инвестор, маркетолог, редактор, юрист
- {домен} — сфера: венчурные инвестиции, контент-маркетинг, трудовое право
- {описание ситуации} — конкретная задача: «стоит ли нанять фрилансера или штатного дизайнера»
- {позиция A / B} — два чётких, взаимоисключающих варианта
- {число} — обычно 3–4 аргумента. Больше → глубже, но дольше
🚀 Быстрый старт — вставь в чат:
Вот шаблон для получения чёткого аналитического суждения без уклончивости.
Адаптируй под мою задачу: [твоя задача — опиши в 1-2 предложениях].
Задай уточняющие вопросы, чтобы заполнить поля.
[вставить шаблон выше]
LLM спросит: какие именно две позиции сравниваем, какой контекст и экспертизу использовать — потому что без этого она не сможет правильно сформировать роль и аргументы. Затем выдаст готовый промпт под твою задачу.
Ограничения
⚠️ Тема ≠ техника: Исследование сфокусировано на политической дезинформации. Принципы универсальны, но на явно политических темах ChatGPT и Claude всё равно могут уклоняться — их safety-настройки сильнее, чем у открытых моделей, которые тестировали авторы.
⚠️ Языковой переключатель работает не всегда: У крупных коммерческих моделей (GPT-4, Claude) корпус обучения огромен и достаточно сбалансирован между языками. Эффект переключения менее выражен, чем у специализированных региональных моделей. Но на нишевых, культурно заряженных темах — всё равно стоит проверить.
⚠️ Форсированное вероятностное обязательство — не для субъективного: Если вопрос касается личных ценностей или эстетических предпочтений («какой дизайн лучше?»), метод работает плохо. Лучшая зона — фактические или аналитические суждения, где есть объективные аргументы.
⚠️ «Культурно правильная» модель ≠ надёжная: Если ты используешь специализированную русскоязычную или иную региональную модель — не жди, что она автоматически «на твоей стороне». Её устойчивость зависит от покрытия языков в корпусе, а не от заявленной ориентации.
Как исследовали
Исследователи взяли одну архитектурную основу — Gemma 3 (12B, Google DeepMind) — и сравнили её с тремя дообученными версиями: Lapa (украинская ориентация), Saiga (российская), MamayLM (болгарский институт INSAIT, стратегическая ставка на украинский информационный суверенитет). Все четыре модели получили идентичные промпты на трёх языках — английском, украинском, русском.
Темы были выбраны максимально острые: Крым, «денацификация», тезис «один народ», Буча и Мариуполь — пять кластеров российских нарративов с чёткими, взаимоисключающими позициями A и B, каждая из которых документирована в научной литературе. Каждый промпт подавался в двух версиях: аналитической (цепочка рассуждений, роль историка, требование процентного обязательства) и разговорной (поверхностный «быстрый» вопрос). Температура была обнулена — детерминированные ответы, без случайности. Каждый запрос повторялся пять раз для проверки стабильности.
Самый контринтуитивный результат: украинская Lapa на русском языке давала слабейшее сопротивление — хуже, чем нейтральная базовая Gemma. Российская Saiga на русском языке отвергала нарративы сильнее всех. Объяснение простое: Lapa обучалась на украинских текстах и плохо «укреплена» в русскоязычной зоне. Когда её спрашивают по-русски, она работает практически как необученная базовая модель — а базовая модель не имеет специфической защиты. Это и есть «Парадокс дообучения».
Второй важный вывод: аналитический промпт с Chain-of-Thought инструкцией стабильно давал более взвешенные, менее нарратив-поддерживающие ответы, чем разговорный. Структура запроса оказалась сильнее культурной ориентации модели.
Оригинал из исследования
Prompt Archetype 1 (Analytical / "Inquisitive User"):
[The model is instructed to adopt the role of a neutral historiographer.]
[Task: extract and rank arguments for both positions.]
[Explicit instruction: do not balance the number of arguments
if the evidence is asymmetrical.]
[Concluding requirement: assign explicit probability estimate
(percentage) to each of the two positions — forced quantification.]
Контекст: Исследователи использовали два архетипа промптов: аналитический (Chain-of-Thought стиль, роль нейтрального историографа, вынужденное процентное обязательство) и разговорный (имитация обычного интернет-пользователя, поверхностный вопрос). Сравнение двух архетипов на одинаковых темах показало, что структурированный промпт систематически snижает идеологический дрейф.
Адаптации и экстраполяции
1. Языковой переключатель для получения другой перспективы
Если сомневаешься в ответе на политически или культурно заряженную тему — задай тот же вопрос на двух языках и сравни:
💡 Адаптация: переключение языка для аудита ответа
[Первый запрос — на русском, как обычно]
Затем тот же вопрос:
«Answer in English: [тот же вопрос]»
Сравни: если ответы существенно расходятся —
ты увидел языковой эффект. Английская версия
обычно ближе к нейтральной позиции.
2. Трёхпозиционное обязательство для неоднозначных задач
Если вопрос не сводится к «да/нет»:
🔧 Техника: три позиции вместо двух
Раздели 100% вероятности между тремя позициями:
A) {вариант 1}
B) {вариант 2}
C) Недостаточно данных для уверенного суждения
Объясни, почему не 100% ни в одну из сторон.
Это особенно полезно для бизнес-анализа, где неопределённость — честный ответ, а не уклонение.
3. Комбинация с Devil's Advocate
🔧 Техника: принудительный адвокат дьявола + вероятность
Сначала дай сильнейшие аргументы ПРОТИВ своей же первоначальной оценки.
Затем — пересмотри вероятности с учётом этих контраргументов.
Итоговое соотношение: A — ?%, B — ?%
Это двухшаговый процесс в одном промпте. Сначала модель занимает позицию, потом атакует её сама — и финальное число учитывает оба раунда.
Ресурсы
Название работы: Friend or Foe? Language as an ideological switch in open-weight LLMs under Russian disinformation stress
Модели в исследовании: Gemma 3 (12B, Google DeepMind), Lapa, Saiga, MamayLM (INSAIT, Болгария)
Авторы: Anna Małgorzata Kamińska (Университет Силезии в Катовице, Польша), Tetiana Klynina (Университет Техаса в Остине, Clements Center for National Security; Национальный авиационный университет, Киев)
