arXiv:2605.29637 72 28 мая 2026 г. FREE

TinT (Translate-in-Thought): скрытый английский в голове модели для лучших ответов на русском

КЛЮЧЕВАЯ СУТЬ

Парадокс: спросить по-русски о финансах или технологиях — буквально хуже, чем по-английски. LLM хранит знание об одном и том же факте на разных «глубинах» в зависимости от языка вопроса. TinT даёт возможность получать насыщенные ответы на русском, не переходя на английский вручную. Одна строка: «обработай внутренне на английском, ответь только на русском» — и модель тянет из более богатого слоя. Без дообучения, без лишних запросов, одним промптом.

Адаптировать под запрос

⚡

TL;DR

Когда LLM «знает» что-то, это знание хранится неравномерно — на английском глубже, чем на русском. Спросишь по-русски о фактах, датах, технических концепциях — модель может ошибиться или дать расплывчатый ответ. Тот же вопрос по-английски — ответит уверенно. TinT (Translate-in-Thought) — техника, при которой ты инструктируешь модель обработать вопрос внутри на английском, а финальный ответ выдать на русском.

Главная находка: между «спросить на родном языке» и «спросить на английском» есть точка перелома — flip point. Ниже этой точки модель ошибается, выше — отвечает правильно. Эксперименты показали, что достаточно лишь подмешать английские термины в запрос (code-mixing) или попросить модель «думать по-английски», чтобы перепрыгнуть через эту точку. Без переобучения, без API, одним промптом.

Как это работает: одна строка в промпте — «думай внутренне на английском, ответь только на русском» — активирует в модели более богатый английский слой знаний. Промежуточный перевод не виден пользователю, токены не тратятся лишние, ответ приходит быстрее, чем при двухшаговом переводе.

🔬

Схема метода

Четыре стратегии от худшей к лучшей (в одном запросе):

ВАРИАНТ 1 — Baseline (хуже всего):
Просто спросить по-русски → модель отвечает из "русского слоя"

ВАРИАНТ 2 — 2Step-EN (лучший результат, два запроса):
ЗАПРОС 1: Переведи вопрос на английский
ЗАПРОС 2: Ответь на переведённый вопрос → ответ по-английски → вручную перевести

ВАРИАНТ 3 — 1Step-EN+Ans (один запрос, видны промежуточные шаги):
"Переведи этот вопрос на английский, затем сразу ответь" → перевод + ответ

ВАРИАНТ 4 — TinT-EN ⭐ (один запрос, только ответ):
"Обработай вопрос внутренне на английском, покажи только финальный ответ на русском"
→ только результат

Все варианты работают в обычном чате, никакого кода не нужно.

🚀

Пример применения

Задача: Ты готовишься к переговорам с инвестором и хочешь разобраться в метриках оценки SaaS-стартапов — LTV, CAC, churn, Rule of 40. Модель по-русски даёт общие слова, без конкретики.

Промпт (TinT-EN):

Я задаю тебе вопрос по-русски, но ты должен обработать его внутренне на английском. 
Промежуточные шаги не показывай — выдай только готовый ответ на русском.

Вопрос: Как инвесторы используют Rule of 40 для оценки SaaS-стартапов и где граница 
между "нормой" и "красными флагами" по этому показателю?

Результат: Модель генерирует ответ, используя более насыщенный английский слой знаний о SaaS-метриках. Ты получишь конкретный, структурированный ответ с числами и примерами — вместо расплывчатого «это показатель роста и прибыльности». Промежуточный «перевод в голове» не видишь — только финальный русский текст.

🧠

Почему это работает

LLM обучается на текстах из интернета. Английских текстов — несравнимо больше, они точнее и детальнее. Поэтому знание об одном и том же факте хранится на разных "глубинах" в зависимости от языка запроса. Русский — хороший язык, но английский слой всё равно богаче по специализированным темам: финансы, технологии, медицина, наука.

Модель умеет хорошо переключаться между языками внутри одного контекста — это проявляется, когда двуязычные люди в обычной речи перемежают слова разных языков. Именно это использует TinT: инструкция «думай по-английски» не заставляет модель «выполнять код» — она задаёт паттерн генерации, при котором внутренние цепочки рассуждений идут через более богатый английский слой.

Рычаги управления промптом: - Хочешь видеть промежуточный перевод → используй 1Step-EN+Ans вместо TinT - Хочешь максимальное качество и не жалко лишнего запроса → используй 2Step-EN - Для технических тем: подмешивай английские термины прямо в русский вопрос (code-mixing) — это тоже помогает, без явных инструкций про "думать по-английски"

📋

Шаблон промпта

Я задаю тебе вопрос на русском, но обработай его внутренне на английском языке.
Промежуточный перевод не показывай. Выдай только финальный ответ на русском.

Вопрос: {вопрос}

Плейсхолдеры: - {вопрос} — любой фактический, аналитический или технический вопрос на русском

Вариант с code-mixing (без явных инструкций):

Объясни {тема} — включая {английский_термин_1}, {английский_термин_2} и их связь с {контекст}.
Ответь на русском.

Пример: «Объясни unit economics для маркетплейса — включая LTV, CAC ratio и cohort analysis, применительно к Wildberries или Ozon.»

🚀 Быстрый старт — вставь в чат:

Вот шаблон TinT (Translate-in-Thought). Адаптируй под мою задачу: [твоя задача].
Задавай вопросы, чтобы заполнить поля.

Я задаю тебе вопрос на русском, но обработай его внутренне на английском языке.
Промежуточный перевод не показывай. Выдай только финальный ответ на русском.

Вопрос: {вопрос}

LLM спросит какая тема и какой формат нужен — потому что TinT особенно полезен для конкретных задач (факты, анализ, техническое объяснение), и ей нужно понять, где именно активировать «английский режим».

⚠️

Ограничения

⚠️ Высокоресурсные языки: Для русского выигрыш будет меньше, чем для ассамского или телугу — русский и так неплохо представлен в обучающих данных. Но на узкоспециализированных темах разница заметна.

⚠️ Маленькие модели: На совсем маленьких моделях TinT не помогает или даже ухудшает результат — у них нет достаточной «ёмкости» для внутреннего переключения языков. Используй ChatGPT, Claude или крупные Gemini — не бесплатные Llama-1B.

⚠️ Культурные и субъективные факты: TinT хуже работает на вопросах о локальной культуре, семантике, народных традициях — там английский слой беднее, а не богаче родного.

⚠️ Некоторые языки не спасут: Для языков с очень малым представлением в обучении (редкие диалекты, некоторые региональные языки) внутренний перевод не перекрывает фундаментальный пробел в данных.

🔍

Как исследовали

Исследователи из IISER Bhopal построили IndicKLAR — набор из 2619 вопросов на 18 индийских языках, где каждый вопрос существует в трёх вариантах: на родном языке (например, хинди), code-mixed (хинди + английские слова), и по-английски. Это позволило сравнивать один и тот же вопрос в трёх формах — идеальный контроль эксперимента. Тестировали девять моделей весом от 1B до 14B параметров: Llama 3.1/3.2, Gemma 3, Qwen 2.5.

Самый неожиданный результат: code-mixed запросы почти полностью закрывали разрыв с английским — без каких-либо изменений в модели. Разрыв «родной язык → английский» мог достигать 50 процентных пунктов точности. Code-mixed сокращал его до 5 пунктов. Это неожиданно, потому что code-mixed — «неправильный» язык, смесь. Но именно эта смесь даёт модели нужные «якоря».

Нашли и ещё один эффект: у всех моделей есть точка перелома на траектории «родной → code-mixed → английский». Ниже этой точки — модель ошибается, выше — отвечает правильно. И TinT переносит работу модели выше этой точки, даже когда сам запрос написан на родном языке.

💡

Адаптации и экстраполяции

📌

🔧 Code-mixing без явных инструкций → естественное усиление запроса

Если не хочешь явно инструктировать модель «думай по-английски» — просто включи английские термины прямо в русский вопрос. Исследование показало, что выигрыш идёт именно от смысловых английских якорей, а не от смены алфавита.

Пример:

Объясни разницу между growth hacking и product-led growth на примере российских 
B2B SaaS-компаний. Что важнее на стадии pre-seed?

Здесь английские термины работают как «ключи» к нужному слою знаний — без дополнительных инструкций.

📌

🔧 TinT для анализа документов → вытащить больше из русскоязычного текста

Проанализируй следующий фрагмент договора. Обработай содержание внутренне на английском (не показывай перевод), затем выдай только список рисков на русском.

Договор: {текст}

Полезно для юридических, финансовых, медицинских текстов — где английский слой модели богаче прецедентами.

🔗

Ресурсы

Название работы: Evaluating Cross-lingual Knowledge Consistency in Code-Mixed vis-a-vis Indian Languages using IndicKLAR

Авторы: Debajyoti Mazumder, Divyansh Pathak, Prashant Kodali, Aditya Joshi, Akshay Agarwal, Jasabanta Patro

Организации: IISER Bhopal (Indian Institute of Science Education and Research), Microsoft Corporation, UNSW Sydney

Бенчмарк: IndicKLAR — расширение KLAR-CLC (Wang et al., 2025b)

📋 Дайджест исследования

Ключевая суть

Принцип работы

В основе — идея «точки перелома». Есть порог: ниже него модель ошибается, выше — отвечает уверенно. Подмешать английские термины в русский вопрос или сказать «думай по-английски» — достаточно, чтобы перепрыгнуть этот порог. Это работает потому, что модель умеет переключаться между языками внутри одного контекста — двуязычные люди делают так постоянно. TinT просто использует эту способность целенаправленно, а не случайно.

Почему работает

Модель обучалась на текстах из интернета. Английских текстов о финансах, медицине, технологиях — на порядок больше, и они точнее. Поэтому концепция «Rule of 40» или «churn rate» представлена в английском слое богаче, чем в русском. Инструкция «думай по-английски» не заставляет модель делать буквальный перевод — она задаёт паттерн генерации через более насыщенный слой знаний. Финальный перевод на русский — дешёвая операция: это модели даётся хорошо, данных для этого хватает.

Когда применять

Технические и фактические вопросы — финансы, IT, медицина, наука, юридическая терминология. Особенно полезен когда модель по-русски выдаёт расплывчатые объяснения, а тот же вопрос по-английски — с цифрами и конкретикой. НЕ подходит для вопросов о локальной культуре, народных традициях, региональной специфике — там английский слой беднее, а не богаче русского.

Мини-рецепт

1. Добавь инструкцию в начало: «Я задаю вопрос по-русски, но обработай его внутренне на английском. Промежуточные шаги не показывай — выдай только финальный ответ на русском.»
2. Задай вопрос как обычно — на русском, без изменений.
3. Или пойди ещё проще: подмешай ключевые английские термины прямо в русский вопрос, без явных инструкций. Модель сама переключится — через «точку перелома».
4. Если нужно максимальное качество и не жалко второго запроса: сначала попроси перевести вопрос на английский, потом ответить на переведённую версию. Это чуть точнее, но в два шага.

Примеры

[ПЛОХО]: `Объясни метрики успеха подписочного бизнеса` (Получишь общие слова: «это показатели роста и удержания клиентов») [ХОРОШО — вариант TinT]: `Я задаю вопрос по-русски, но обработай его внутренне на английском. Промежуточные шаги не показывай — только финальный ответ на русском. Вопрос: Как инвесторы используют Rule of 40 для оценки SaaS-стартапов и где граница между нормой и красными флагами?` [ХОРОШО — вариант с подмешиванием терминов]: `Объясни метрики SaaS-бизнеса — включая LTV, CAC ratio, churn rate и Rule of 40, применительно к подписочным сервисам. Ответь на русском.`

Источник: Evaluating Cross-lingual Knowledge Consistency in Code-Mixed vis-a-vis Indian Languages using IndicKLAR

ArXiv ID: 2605.29637 | Сгенерировано: 2026-05-29 15:33

Проблемы LLM

Проблема	Суть	Как обойти
Знания модели хранятся неравномерно по языкам	Обучающих данных на английском намного больше. Особенно по узким темам: финансы, медицина, технологии. Задаёшь вопрос по-русски — модель отвечает из «бедного слоя». Те же факты по-английски — ответ точнее и подробнее. Это не страшно для бытовых тем. На узкоспециализированных — разница заметна	Попроси модель обработать вопрос внутри на английском. Ответ выдать на русском. Одна строка в запросе — и модель использует более богатый слой знаний

Методы

Метод Суть

Внутренний перевод — точнее без лишних шагов Добавь в начало запроса: Обработай вопрос внутренне на английском. Промежуточный перевод не показывай. Выдай только ответ на русском. Затем задай вопрос как обычно. Почему работает: модель переключает генерацию через более насыщенный английский слой. Пользователь видит только русский ответ. Лишних токенов нет. Когда применять: технические объяснения, факты, аналитика по специализированным темам. Когда не даст эффекта: культурные вопросы, локальный контекст, маленькие модели

Метод	Суть
Внутренний перевод — точнее без лишних шагов	Добавь в начало запроса: `Обработай вопрос внутренне на английском. Промежуточный перевод не показывай. Выдай только ответ на русском.` Затем задай вопрос как обычно. Почему работает: модель переключает генерацию через более насыщенный английский слой. Пользователь видит только русский ответ. Лишних токенов нет. Когда применять: технические объяснения, факты, аналитика по специализированным темам. Когда не даст эффекта: культурные вопросы, локальный контекст, маленькие модели

📖 Простыми словами

Evaluating Cross-lingual Knowledge Consistency in Code-Mixed vis-a-vis IndianLanguagesusingIndicKLAR

arXiv: 2605.29637

Современные нейросети — это не энциклопедии, а скорее гигантские библиотеки, где на английском языке стоят стеллажи с актуальными данными, а на русском — пара пыльных полок с общими фразами. Проблема в том, что знания в LLM распределены неравномерно. Когда ты спрашиваешь модель о чем-то сложном на русском, она лезет в свой «бедный» сектор памяти и начинает выдавать воду или откровенно лажать. Это называется проблемой кросс-языковой консистентности: модель буквально знает ответ, но не может его достать, потому что ты обратился к ней не на том языке.

Это как если бы ты пришел к профессору-полиглоту, который всю жизнь писал диссертации на английском, и начал пытать его сложными терминами на ломаном суахили. Он вроде и понимает, о чем речь, но ответить может только на уровне детского сада. Формально контакт есть, но толку ноль. Чтобы вытащить из него реальную экспертизу, нужно заставить его думать на основном языке, даже если итоговый ответ он должен выдать на твоем.

Метод TinT (Translate-in-Thought) — это хак, который заставляет модель переводить запрос «в уме» на английский, там находить нужные факты и уже потом переводить результат обратно. Самый эффективный способ — это явная инструкция, где ты просишь модель сначала перевести вопрос, затем расписать логику ответа на английском и только в конце выдать русский текст. Исследования показывают, что такая цепочка рассуждений вытаскивает из модели скрытые знания, которые при обычном запросе на русском просто «спят».

Тестировали эту штуку на индийских языках, где данных в сети еще меньше, чем в рунете, но принцип универсален. Это работает для любой сложной темы: от настройки серверов и медицинских диагнозов до разбора юридических тонкостей. Если тема требует глубины, а не простого пересказа Википедии, прямой запрос на русском — это путь к галлюцинациям. Использование английского как «внутреннего движка» превращает модель из посредственного переводчика в реального эксперта.

Короче, если тебе нужен не просто текст, а фактическая точность, перестань общаться с AI напрямую. Используй промпт, заставляющий модель прогонять задачу через английский слой. Это убирает риск того, что нейронка начнет нести чушь просто потому, что в её «русском отделе» не нашлось нужной папки. TinT — это мост к знаниям, которые модель в тебе скрывает, и игнорировать этот метод — значит сознательно соглашаться на контент второго сорта.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

Выберите модель ИИ:

Ваш запрос:

0 / 2000

~0.5-2 N-токенов ~10-30с

~0.3-1 N-токенов ~5-15с

Меню