3,583 papers
arXiv:2606.08512 73 7 июня 2026 г. FREE

«Язык как идеологический переключатель»: почему LLM отвечает по-разному на одинаковый вопрос — в зависимости от языка запроса

КЛЮЧЕВАЯ СУТЬ
Парадокс: украинско-ориентированная модель оказалась наименее устойчивой к российским нарративам — именно когда её спрашивали на русском. Не потому что плохо обучена. А потому что просто не знает, как вести себя на чужом языке, и откатывается к базовой версии, где нарративы встречают меньше сопротивления. Из этого открытия вытащили два рабочих инструмента: язык запроса — это не перевод, это вход в разную часть обучающего корпуса — смени язык, получи другую перспективу. И второе: вместо размытого «что ты думаешь?» — попроси модель разделить 100% между двумя позициями после того как она выдала аргументы. Уйти некуда — логика требует числа.
Адаптировать под запрос

TL;DR

Один и тот же вопрос, заданный на русском и на украинском языке, вызывает у одной и той же модели принципиально разные ответы по политически чувствительным темам. Исследователи протестировали четыре модели на одной архитектурной основе: базовую Gemma 3 и три дообученные версии под украинскую, российскую и болгарскую аудиторию. Задавали одинаковые вопросы на трёх языках — и измеряли, насколько модель воспроизводит или отвергает ключевые нарративы российской дезинформации об Украине.

Главная находка называется «Парадокс дообучения»: украинско-ориентированная модель оказалась наименее устойчивой к российским нарративам, когда её спрашивали на русском языке. Российско-ориентированная — наоборот, отвергала их сильнее всех. Причина: украинская модель дообучалась преимущественно на украинских текстах и просто «не знает», как вести себя на русском — и падает в зону базовой модели, которую российские нарративы встречают мягче. Язык запроса активирует разные «слои» обучения. Исследователи назвали это hidden agent effect (эффект скрытого агента): выбор языка ведёт себя как переключатель, который включает разные идеологические зоны одной и той же модели.

Из этого вытекает два практических вывода. Первое: если нужно получить менее «заряженный» ответ по чувствительной теме — смени язык запроса. Английский для большинства моделей нейтральнее русского или украинского. Второе: чтобы модель не уходила в уклончивые формулировки — используй формат вынужденного вероятностного обязательства: не «что ты думаешь?», а «раздели 100% между двумя позициями и объясни».


🔬

Схема метода

Это исследование-находка, не единый метод. Из него можно вытащить три независимые техники:

ТЕХНИКА 1: Языковой переключатель
Запрос на языке A → один тип ответа
Тот же запрос на языке B → другая «зона» обучения активируется
Применение: переключай язык, чтобы получить другую перспективу или нейтральнее позицию

ТЕХНИКА 2: Вынужденное вероятностное обязательство
Вместо: «Как ты оцениваешь X?»
→ «Распредели 100% вероятности между позицией A и позицией B.
   Сначала выпиши аргументы за каждую. Потом назови число.»
Устраняет: уклончивость и «риторическое балансирование»

ТЕХНИКА 3: Аналитический vs. разговорный фрейм
Разговорный вопрос → поверхностный, склонный к клише ответ
Аналитический фрейм (роль нейтрального эксперта + задача + критерий) → глубже и точнее
Применение: для сложных суждений — всегда добавляй структуру

Все три техники работают в обычном чате, без кода и API.


🚀

Пример применения

Задача: Основатель небольшой IT-компании хочет понять, стоит ли расширяться в регионы — или оставаться в Москве. Обычный вопрос «что думаешь?» даёт размытый ответ в духе «смотря что важно для вас». Нужно чёткое суждение с разбором.

Промпт (Техника 2 + Техника 3):

Ты — нейтральный бизнес-аналитик, без предвзятости к одной из позиций.

Задача: оцени стратегическое решение для IT-компании (10 человек, B2B-разработка, Москва, выручка ~30 млн ₽/год).

Два варианта:
A) Остаться в Москве, уплотнить клиентскую базу там
B) Открыть представительство в регионе (Казань или Новосибирск), расширить рынок

Инструкция:
1. Выпиши 3–4 сильных аргумента ЗА вариант A
2. Выпиши 3–4 сильных аргумента ЗА вариант B
3. Если аргументы неравнозначны — не уравнивай их искусственно. Отрази реальный перевес.
4. В конце: раздели 100% вероятности между A и B (например: «A — 65%, B — 35%»)
   и объясни, почему именно такое соотношение.

Что ожидать в ответе:

Модель выдаст два структурированных списка аргументов с разным весом. Интересно то, что она не будет уравнивать их «из вежливости» — именно этого добиваемся инструкцией «не балансируй искусственно». В конце появится чёткое числовое соотношение с объяснением логики — вместо привычного «зависит от ваших приоритетов». Это и есть ценность принудительного обязательства: модель вынуждена взять сторону на основе аргументов, которые сама же выдала.


🧠

Почему это работает

У LLM нет единой «точки зрения» на спорный вопрос. Есть огромное пространство текстов, на которых модель обучалась, где одни позиции встречаются чаще других — в зависимости от языка этих текстов. Когда ты пишешь на конкретном языке, модель активирует статистические паттерны из текстов на этом же языке. Русскоязычный интернет содержит одно распределение позиций по политическим темам, англоязычный — другое. Поэтому язык запроса — это не просто перевод, это вход в разную часть обучающего корпуса.

Второй механизм: LLM обучена уклоняться от конфликтных суждений. Когда ты спрашиваешь расплывчато, она выдаёт «с одной стороны... с другой стороны». Это не честность — это паттерн избегания ответственности, натренированный на отзывах пользователей, которым не нравились резкие суждения. Форсированное вероятностное обязательство ломает этот уход: модель уже высказала аргументы — и теперь должна присвоить им вес. Логика требует числа.

Третий механизм: аналитический фрейм с ролью («ты нейтральный эксперт») и задачей («извлеки аргументы, потом оцени») запускает другой паттерн генерации, чем вопрос в разговорном стиле. Это аналог Chain-of-Thought (выдай рассуждение по шагам): структура запроса меняет структуру ответа.

Рычаги управления: - Асимметрия аргументов → фраза «не уравнивай, если доказательства неравнозначны» даёт модели разрешение быть честной, а не дипломатичной - Язык запроса → переключай для получения другой перспективы или более нейтральной позиции - Диапазон вероятности → можно попросить 3 позиции (A / B / «нет данных») если задача неоднозначная - Роль → чем конкретнее («аналитик McKinsey» vs «бизнес-эксперт»), тем острее позиционирование


📋

Шаблон промпта

Ты — {роль: нейтральный эксперт в области [домен]}.

Задача: оцени {описание ситуации или вопроса}.

Две возможные позиции:
A) {позиция A}
B) {позиция B}

Инструкция:
1. Выпиши {число} сильных аргументов ЗА позицию A
2. Выпиши {число} сильных аргументов ЗА позицию B
3. Если аргументы неравнозначны — не уравнивай искусственно. Отрази реальный перевес.
4. В конце: раздели 100% вероятности между A и B.
   Объясни, почему именно такое соотношение.

Плейсхолдеры: - {роль} — кто оценивает: инвестор, маркетолог, редактор, юрист - {домен} — сфера: венчурные инвестиции, контент-маркетинг, трудовое право - {описание ситуации} — конкретная задача: «стоит ли нанять фрилансера или штатного дизайнера» - {позиция A / B} — два чётких, взаимоисключающих варианта - {число} — обычно 3–4 аргумента. Больше → глубже, но дольше


🚀 Быстрый старт — вставь в чат:

Вот шаблон для получения чёткого аналитического суждения без уклончивости.
Адаптируй под мою задачу: [твоя задача — опиши в 1-2 предложениях].
Задай уточняющие вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит: какие именно две позиции сравниваем, какой контекст и экспертизу использовать — потому что без этого она не сможет правильно сформировать роль и аргументы. Затем выдаст готовый промпт под твою задачу.


⚠️

Ограничения

⚠️ Тема ≠ техника: Исследование сфокусировано на политической дезинформации. Принципы универсальны, но на явно политических темах ChatGPT и Claude всё равно могут уклоняться — их safety-настройки сильнее, чем у открытых моделей, которые тестировали авторы.

⚠️ Языковой переключатель работает не всегда: У крупных коммерческих моделей (GPT-4, Claude) корпус обучения огромен и достаточно сбалансирован между языками. Эффект переключения менее выражен, чем у специализированных региональных моделей. Но на нишевых, культурно заряженных темах — всё равно стоит проверить.

⚠️ Форсированное вероятностное обязательство — не для субъективного: Если вопрос касается личных ценностей или эстетических предпочтений («какой дизайн лучше?»), метод работает плохо. Лучшая зона — фактические или аналитические суждения, где есть объективные аргументы.

⚠️ «Культурно правильная» модель ≠ надёжная: Если ты используешь специализированную русскоязычную или иную региональную модель — не жди, что она автоматически «на твоей стороне». Её устойчивость зависит от покрытия языков в корпусе, а не от заявленной ориентации.


🔍

Как исследовали

Исследователи взяли одну архитектурную основу — Gemma 3 (12B, Google DeepMind) — и сравнили её с тремя дообученными версиями: Lapa (украинская ориентация), Saiga (российская), MamayLM (болгарский институт INSAIT, стратегическая ставка на украинский информационный суверенитет). Все четыре модели получили идентичные промпты на трёх языках — английском, украинском, русском.

Темы были выбраны максимально острые: Крым, «денацификация», тезис «один народ», Буча и Мариуполь — пять кластеров российских нарративов с чёткими, взаимоисключающими позициями A и B, каждая из которых документирована в научной литературе. Каждый промпт подавался в двух версиях: аналитической (цепочка рассуждений, роль историка, требование процентного обязательства) и разговорной (поверхностный «быстрый» вопрос). Температура была обнулена — детерминированные ответы, без случайности. Каждый запрос повторялся пять раз для проверки стабильности.

Самый контринтуитивный результат: украинская Lapa на русском языке давала слабейшее сопротивление — хуже, чем нейтральная базовая Gemma. Российская Saiga на русском языке отвергала нарративы сильнее всех. Объяснение простое: Lapa обучалась на украинских текстах и плохо «укреплена» в русскоязычной зоне. Когда её спрашивают по-русски, она работает практически как необученная базовая модель — а базовая модель не имеет специфической защиты. Это и есть «Парадокс дообучения».

Второй важный вывод: аналитический промпт с Chain-of-Thought инструкцией стабильно давал более взвешенные, менее нарратив-поддерживающие ответы, чем разговорный. Структура запроса оказалась сильнее культурной ориентации модели.


📄

Оригинал из исследования

Prompt Archetype 1 (Analytical / "Inquisitive User"):

[The model is instructed to adopt the role of a neutral historiographer.]
[Task: extract and rank arguments for both positions.]
[Explicit instruction: do not balance the number of arguments 
if the evidence is asymmetrical.]
[Concluding requirement: assign explicit probability estimate 
(percentage) to each of the two positions — forced quantification.]

Контекст: Исследователи использовали два архетипа промптов: аналитический (Chain-of-Thought стиль, роль нейтрального историографа, вынужденное процентное обязательство) и разговорный (имитация обычного интернет-пользователя, поверхностный вопрос). Сравнение двух архетипов на одинаковых темах показало, что структурированный промпт систематически snижает идеологический дрейф.


💡

Адаптации и экстраполяции

📌

1. Языковой переключатель для получения другой перспективы

Если сомневаешься в ответе на политически или культурно заряженную тему — задай тот же вопрос на двух языках и сравни:

💡 Адаптация: переключение языка для аудита ответа

[Первый запрос — на русском, как обычно]

Затем тот же вопрос:
«Answer in English: [тот же вопрос]»

Сравни: если ответы существенно расходятся — 
ты увидел языковой эффект. Английская версия 
обычно ближе к нейтральной позиции.

📌

2. Трёхпозиционное обязательство для неоднозначных задач

Если вопрос не сводится к «да/нет»:

🔧 Техника: три позиции вместо двух

Раздели 100% вероятности между тремя позициями:
A) {вариант 1}
B) {вариант 2}  
C) Недостаточно данных для уверенного суждения

Объясни, почему не 100% ни в одну из сторон.

Это особенно полезно для бизнес-анализа, где неопределённость — честный ответ, а не уклонение.


📌

3. Комбинация с Devil's Advocate

🔧 Техника: принудительный адвокат дьявола + вероятность

Сначала дай сильнейшие аргументы ПРОТИВ своей же первоначальной оценки.
Затем — пересмотри вероятности с учётом этих контраргументов.
Итоговое соотношение: A — ?%, B — ?%

Это двухшаговый процесс в одном промпте. Сначала модель занимает позицию, потом атакует её сама — и финальное число учитывает оба раунда.


🔗

Ресурсы

Название работы: Friend or Foe? Language as an ideological switch in open-weight LLMs under Russian disinformation stress

Модели в исследовании: Gemma 3 (12B, Google DeepMind), Lapa, Saiga, MamayLM (INSAIT, Болгария)

Авторы: Anna Małgorzata Kamińska (Университет Силезии в Катовице, Польша), Tetiana Klynina (Университет Техаса в Остине, Clements Center for National Security; Национальный авиационный университет, Киев)


📋 Дайджест исследования

Ключевая суть

Парадокс: украинско-ориентированная модель оказалась наименее устойчивой к российским нарративам — именно когда её спрашивали на русском. Не потому что плохо обучена. А потому что просто не знает, как вести себя на чужом языке, и откатывается к базовой версии, где нарративы встречают меньше сопротивления. Из этого открытия вытащили два рабочих инструмента: язык запроса — это не перевод, это вход в разную часть обучающего корпуса — смени язык, получи другую перспективу. И второе: вместо размытого «что ты думаешь?» — попроси модель разделить 100% между двумя позициями после того как она выдала аргументы. Уйти некуда — логика требует числа.

Принцип работы

Уклончивость («зависит от ваших приоритетов») — это не честность. Это натренированный паттерн: пользователи ставили плохие оценки за резкие суждения, модель выучила уходить в «с одной стороны... с другой стороны». Принудительное вероятностное обязательство ломает этот уход: сначала аргументы — потом число. Модель уже высказалась — и теперь вынуждена взвесить собственные слова. Добавь фразу «не уравнивай, если доказательства неравнозначны» — даёшь разрешение быть честной, а не дипломатичной. Дополнительно: аналитический фрейм с конкретной ролью и структурой («ты нейтральный эксперт + задача + критерий») запускает другой режим генерации, чем разговорный вопрос. Это как разница между «ну как тебе?» и «оцени по пяти критериям».

Почему работает

У модели нет единой точки зрения. Есть статистика огромного корпуса текстов — разная для каждого языка. Русскоязычный и англоязычный интернет содержат разное распределение позиций по одним и тем же темам — и модель это воспроизводит автоматически. Поэтому украинская модель, обученная почти исключительно на украинских текстах, при запросе на русском просто не активирует нужные паттерны — она плывёт в зону базовой модели. Форсированное распределение вероятностей работает по другой причине: модель обучена избегать конфликтных суждений, но не обучена противоречить собственным аргументам. Если она сама вывела перевес — соотношение 70/30 логически неизбежно. Это ловушка для уклончивости, которую модель не может обойти без явного противоречия.

Когда применять

Для аналитических и деловых суждений: выбор стратегии, сравнение вариантов найма, оценка рисков — особенно когда стандартный ответ сводится к «смотря что для вас важно». Языковой переключатель — для нишевых, культурно заряженных тем: задай один и тот же вопрос на русском и английском, сравни — иногда разрыв удивит. НЕ подходит для субъективных эстетических вопросов («какой логотип лучше?»): принудительное число здесь просто произвол. Также не жди чудес на явно политических темах в крупных коммерческих моделях — их фильтры безопасности сильнее, чем у открытых моделей, которые тестировали авторы исследования.

Мини-рецепт

1. Задай роль точно: не «помоги разобраться», а Ты — нейтральный эксперт в области [домен] без предвзятости к одной из позиций
2. Опиши ситуацию с цифрами: конкретный контекст — размер команды, бюджет, ограничения. Без цифр модель уйдёт в обобщения
3. Сформулируй две чёткие позиции: взаимоисключающие варианты A и B — не «что лучше», а «вот вариант А, вот вариант Б»
4. Попроси аргументы: выпиши 3–4 сильных аргумента за каждую сторону
5. Снеси предохранитель: добавь фразу если аргументы неравнозначны — не уравнивай искусственно, отрази реальный перевес
6. Требуй число в конце: раздели 100% между A и B и объясни, почему именно такое соотношение

Если задача неоднозначная — добавь третью позицию: «В — недостаточно данных для выбора».

Примеры

[ПЛОХО] : Стоит ли мне нанять штатного дизайнера или работать с фрилансером?
[ХОРОШО] : Ты — нейтральный аналитик в найме без предвзятости к одному из вариантов. Задача: оцени решение для небольшого продуктового стартапа (10 человек, первая версия продукта готова, выручка ~15 млн руб/год). Два варианта: A) Нанять штатного дизайнера — 120 000 руб/мес, полная занятость, нужна онбординг-неделя B) Работать с фрилансером — 30–50 000 руб/проект, гибко, но без погружения в продукт Инструкция: 1. Выпиши 3–4 сильных аргумента ЗА вариант A 2. Выпиши 3–4 сильных аргумента ЗА вариант B 3. Если аргументы неравнозначны — не уравнивай искусственно 4. В конце: раздели 100% вероятности между A и B. Объясни соотношение.
Источник: Friend or Foe? Language as an ideological switch in open-weight LLMs under Russian disinformation stress (2606.08512)
ArXiv ID: 2606.08512 | Сгенерировано: 2026-06-09 04:23

Проблемы LLM

ПроблемаСутьКак обойти
Модель уклоняется от оценки на спорных вопросахСпрашиваешь "что лучше — вариант А или Б?". Получаешь "с одной стороны... с другой стороны". Это не честность. Модель обучена избегать резких суждений — пользователи жаловались на них. Итог: ответ, из которого нельзя извлечь решениеПопроси распределить 100% между позициями: "раздели 100% между А и Б, объясни почему". Модель уже выдала аргументы — и вынуждена присвоить им вес. Добавь: "не уравнивай, если доказательства неравнозначны"

Методы

МетодСуть
Вынужденное распределение вероятностей — получи позицию вместо уклончивости1. Попроси выписать аргументы за каждую сторону. 2. Добавь: "если аргументы неравнозначны — не уравнивай". 3. В конце: "раздели 100% между позицией A и позицией B. Объясни соотношение". Почему работает: Сначала модель сама строит аргументы. Потом логика требует числового итога — уклониться уже нельзя. Фраза "не уравнивай" снимает запрет быть несправедливым к слабым аргументам. Когда да: аналитические вопросы с объективными критериями. Когда нет: субъективные предпочтения, эстетика
📖 Простыми словами

Friend or Foe?Languageas an ideological switch in open-weightLLMsunder Russian disinformation stress

arXiv: 2606.08512

Язык для нейросети — это не просто способ передачи информации, а идеологический переключатель. Когда ты меняешь язык запроса, ты не просто переводишь слова, ты буквально переносишь модель в другой «пузырь» данных. У LLM нет своего мнения, зато есть колоссальная память о том, что писали люди. В итоге одна и та же модель превращается в цифрового хамелеона: на русском она выдает одни тезисы, а на украинском или английском — диаметрально противоположные, просто потому что так устроены статистические связи в ее голове.

Это похоже на то, как если бы ты пришел в бар к старому знакомому, который одинаково хорошо знает и физику, и эзотерику. Если ты спросишь его про устройство мира за кружкой пива, он расскажет про кванты, а если начнешь разговор с расклада таро — он на полном серьезе начнет затирать про ретроградный Меркурий. Формально это один и тот же человек, но контекст твоего вопроса активирует у него в мозгу совершенно разные пласты знаний, которые между собой никак не пересекаются.

Исследователи проверили это на модели Gemma 3 и её дообученных версиях, закидывая их вопросами о конфликте на русском, украинском и болгарском. Результат — полный рассинхрон. Модели, «натасканные» на локальных данных, начинают зеркалить ту повестку, которая доминирует в конкретном сегменте интернета. Если в русском корпусе текстов много дезинформации, модель начинает её транслировать, даже если в её «базовой» версии заложены другие фильтры. Это не баг, это фундаментальное свойство архитектуры, где язык определяет выборку фактов.

Хотя тест проводили на политике, принцип универсален для любого бизнеса или аналитики. Если ты спрашиваешь AI о трендах рынка на русском, ты получаешь «мнение» рунета со всеми его перекосами и локальными болячками. Хочешь увидеть глобальную картину — спрашивай на английском, хочешь понять специфику региона — на местном языке. Язык запроса — это фильтр, который отсекает одни источники данных и подтягивает другие, меняя результат до неузнаваемости.

Короче: забудь о том, что нейросеть объективна. Она — зеркало того языка, на котором ты с ней говоришь. Если хочешь получить честный ответ на сложный вопрос, прогони его через разные языки и сравни результаты — скорее всего, ты увидишь две разные личности. Мультиязычный промптинг теперь не просто фишка для перевода, а единственный способ вырваться из идеологического эхо-камеры, которую модель выстраивает вокруг тебя.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с