TL;DR
Модели отвечают иначе в зависимости от языка запроса — и это не просто стиль фраз. Сам «характер» ответа меняется: насколько модель уступает, насколько агрессивна в позиции, насколько жёстко отстаивает точку зрения. Одна и та же задача на русском и на английском — это, по сути, два разных советника.
Причина в том, как устроены обучающие данные. Английский доминирует и по объёму, и по разнообразию — поэтому RLHF (настройка на «безопасное» поведение) работает прежде всего через английский. Когда модель переключается на другой язык, она тянет из другого слоя обучения — с другими культурными ассоциациями, политическими narrative и риторическими нормами. Язык активирует разные «слои памяти» модели.
Важный практический вывод: это не универсальный баг всех моделей. Llama-4 — сильно нестабильна между языками, GPT-4o — устойчива, Gemini-3.1-Pro — уходит в сторону смягчения при нелатинских языках. Знать это важно, если вы полагаетесь на модель в важном анализе. Отдельно: цепочка рассуждений (Chain-of-Thought), заякоренная на конкретный фреймворк, снижает этот эффект — модель держится за правило, а не за языковую ассоциацию.
Схема метода
Это исследование-находка, не техника. Но из неё вытекают два практических инструмента:
ИНСТРУМЕНТ 1: Языковой аудит (2 запроса)
─────────────────────────────────────────
ЗАПРОС А: Тот же промпт на русском → получаешь ответ А
ЗАПРОС Б: Тот же промпт на английском → получаешь ответ Б
Сравни: где позиция жёстче, где больше оговорок, где другие акценты
→ Используй расхождение как инсайт, а не как "правда/неправда"
ИНСТРУМЕНТ 2: Институциональный якорь (1 запрос)
─────────────────────────────────────────────────
ШАБЛОН: "Оценивай строго по критериям: [список].
Сначала пропиши каждый критерий и своё рассуждение по нему.
Только потом — итоговый вывод."
→ Явный фреймворк в промпте снижает «дрейф характера» между языками
и делает ответы последовательнее
Оба инструмента — в одном чате, без кода, без настроек.
Пример применения
Задача: У тебя стартап — доставка «домашней» еды от шеф-поваров по Москве, конкурент «домашних кухонь» на маркетплейсах. Хочешь понять реальные слабые места бизнес-модели, а не получить вежливый список.
Промпт — Инструмент 1 (языковой аудит):
Ты — скептичный венчурный инвестор. Перед тобой стартап: доставка блюд
от домашних шеф-поваров в Москве. Модель: повара регистрируются,
выкладывают меню, клиенты заказывают с доставкой за 90 минут.
Средний чек — 800 рублей.
Твоя задача: найти 3–5 точек, где эта модель разваливается.
Не смягчай. Не ищи плюсы.
— Отправь на русском. Сохрани ответ. — Переведи промпт на английский (или напиши заново по-английски). Отправь. — Сравни: какие риски выделил каждый «инвестор»? Где акценты разные?
Промпт — Инструмент 2 (институциональный якорь):
Ты — скептичный венчурный инвестор. Перед тобой стартап: доставка блюд
от домашних шеф-поваров в Москве. Средний чек — 800 рублей.
Оцени строго по трём критериям:
1. Регуляторные риски (санитария, лицензии, ответственность)
2. Юнит-экономика (можно ли выйти на маржу при таком чеке и доставке)
3. Привлечение и удержание поваров (почему они не уйдут на свой канал)
Для каждого критерия: сначала рассуждение, потом вывод. Не смягчай.
Результат:
Языковой аудит покажет два разных «характера» инвестора — один, вероятно, будет педалировать регуляторику и санитарные нормы, другой — юнит-экономику и конкуренцию от агрегаторов. Расхождение — не баг, а данные: ты увидишь, какие риски модель считает «очевидными» в каждом контексте.
Институциональный якорь даст структурированный разбор без языкового дрейфа — модель держится за критерии, а не за языковые ассоциации.
Почему это работает
LLM не хранит «объективную позицию» — она генерирует следующий токен, опираясь на паттерны из обучающих данных. Когда ты пишешь по-английски, активируется один набор паттернов. По-русски — другой. Это не перевод, это другой слой ассоциаций.
RLHF — настройка на «безопасное» и «полезное» поведение — проводилась преимущественно на английском контенте. Это значит, что «тормоза» у модели лучше работают на английском. На других языках она чаще опирается на то, что было в обучающем корпусе — со всеми его культурными и риторическими нормами.
Институциональный якорь работает потому, что явный фреймворк («оценивай по критериям X») перехватывает управление до того, как языковые ассоциации успевают «окрасить» ответ. Именно это показал DeepSeek-R1: его цепочка рассуждений начиналась с «мой мандат — UNCLOS, я оцениваю строго по нему» — и это буферизировало турецкий языковой якорь.
Рычаги управления: - Явные критерии оценки → чем конкретнее список, тем меньше языкового дрейфа - "Сначала рассуждение, потом вывод" → делает цепочку мышления видимой и управляемой - Выбор модели → GPT-4o устойчив между языками; если стабильность важна — фактор для выбора
Шаблон промпта
Институциональный якорь
Ты — {роль}.
Твоя задача: {задача}.
Оценивай строго по критериям:
1. {критерий_1}
2. {критерий_2}
3. {критерий_3}
Для каждого критерия: сначала пропиши своё рассуждение, потом вывод.
{тон}: не смягчай / будь объективен / ищи только проблемы.
Итоговый вывод — после разбора всех критериев.
Что подставлять:
- {роль} — инвестор, юрист, конкурент, технический директор, скептик
- {задача} — оцени бизнес-модель / найди слабые места / проверь аргументы
- {критерий_1-3} — конкретные параметры анализа, не абстрактные ("юнит-экономика", "регуляторика", "удержание клиентов")
- {тон} — указание на жёсткость/мягкость
🚀 Быстрый старт — вставь в чат:
Вот шаблон институционального якоря для стабильного анализа.
Адаптируй под мою задачу: [твоя задача].
Задавай вопросы, чтобы заполнить поля.
[вставить шаблон выше]
LLM спросит: какая роль нужна, что именно анализировать, какие критерии важны — потому что без этого якорь не работает: критерии и есть механизм стабилизации ответа.
Ограничения
⚠️ Модель-специфично: Эффект сильно различается между моделями. Llama-4 нестабильна, GPT-4o устойчива, Gemini смягчается в нелатинских языках. Универсальной таблетки нет — нужно знать свою модель.
⚠️ Не для простых фактических задач: Языковой дрейф проявляется в риторике, позиции, акцентах — не в фактах. Спросить «сколько стоит айфон» на русском и английском = одинаково.
⚠️ Роль-загрязнение: В исследовании каждая модель играла конкретную геополитическую роль — невозможно полностью отделить эффект языка от эффекта роли. В реальных задачах эти факторы тоже смешиваются.
⚠️ Размер выборки мал: Статистически доказаны только крупные эффекты (у Llama-4, Gemini, DeepSeek). Средние эффекты — «возможно есть, но не доказано». Не абсолютизируй.
Как исследовали
Исследователи придумали синтетический геополитический кризис — вымышленный морской конфликт «Лазурное море», скопированный по структуре с реального греко-турецкого спора о Средиземноморье. Шесть моделей играли роли государств: Llama-4 — Грецию, GPT-4o — Турцию, Gemini — США, DeepSeek-R1 — арбитра.
Единственное, что менялось между группами — язык симуляции: английский или турецкий. Всё остальное было идентично вплоть до хеша SHA-256.
Сыграли 10 независимых игр по 5 раундов в каждом условии. Каждую фразу оценивал отдельный GPT-4o-судья по двум шкалам: насколько уступчива позиция и насколько агрессивна риторика. Важная деталь: когда судья стабильно показывает, что одни модели смягчаются на турецком, а другие становятся жёстче — это опровергает версию «судья просто видит турецкий как агрессивный». Разнонаправленность = чистый сигнал.
Самый любопытный момент — у DeepSeek-R1 включили «горячий микрофон»: захватывали его внутренние рассуждения до публичного ответа. И буквально читали: «Мой мандат — UNCLOS. Я не могу поддержать компромисс, нарушающий Конвенцию, независимо от языка.» Это первое прямое доказательство того, что явный фреймворк в рассуждениях буферизирует языковой дрейф — не гипотеза, а captured chain-of-thought.
Адаптации и экстраполяции
🔧 Языковой аудит для важных решений
Прежде чем доверять анализу модели в ответственной ситуации — получи два ответа: на русском и на английском. Не для того чтобы выбрать «правильный», а чтобы увидеть где картины расходятся. Расхождение = слепое пятно одного из контекстов.
Когда применять: Анализ чужого документа, оценка рисков, юридическая интерпретация, инвестиционный разбор.
🔧 Экстраполяция: «горячий микрофон» как пользовательская техника
Исследователи захватывали скрытые рассуждения DeepSeek-R1. В пользовательском чате аналог — явно попросить модель показать цепочку рассуждений ДО вывода:
Прежде чем дать финальный ответ:
1. Пропиши, какой фреймворк ты используешь для оценки
2. Пройдись по каждому пункту явно
3. Только потом — итог
Я хочу видеть твой процесс, не только результат.
Это одновременно делает ответ прозрачнее и снижает языковой дрейф — модель «якорится» на фреймворке ещё до генерации вывода.
Ресурсы
Работа: The Shibboleth Effect: Auditing the Cross-Lingual Distributional Skew of Large Language Models
Автор: Hakan Mehmetcik — Kellogg Institute for International Studies, University of Notre Dame; факультет политологии, Университет Мармара, Стамбул
Связанные концепции: RLHF, Chain-of-Thought reasoning, multilingual alignment, synthetic statecraft
