TL;DR
Когда LLM «знает» что-то, это знание хранится неравномерно — на английском глубже, чем на русском. Спросишь по-русски о фактах, датах, технических концепциях — модель может ошибиться или дать расплывчатый ответ. Тот же вопрос по-английски — ответит уверенно. TinT (Translate-in-Thought) — техника, при которой ты инструктируешь модель обработать вопрос внутри на английском, а финальный ответ выдать на русском.
Главная находка: между «спросить на родном языке» и «спросить на английском» есть точка перелома — flip point. Ниже этой точки модель ошибается, выше — отвечает правильно. Эксперименты показали, что достаточно лишь подмешать английские термины в запрос (code-mixing) или попросить модель «думать по-английски», чтобы перепрыгнуть через эту точку. Без переобучения, без API, одним промптом.
Как это работает: одна строка в промпте — «думай внутренне на английском, ответь только на русском» — активирует в модели более богатый английский слой знаний. Промежуточный перевод не виден пользователю, токены не тратятся лишние, ответ приходит быстрее, чем при двухшаговом переводе.
Схема метода
Четыре стратегии от худшей к лучшей (в одном запросе):
ВАРИАНТ 1 — Baseline (хуже всего):
Просто спросить по-русски → модель отвечает из "русского слоя"
ВАРИАНТ 2 — 2Step-EN (лучший результат, два запроса):
ЗАПРОС 1: Переведи вопрос на английский
ЗАПРОС 2: Ответь на переведённый вопрос → ответ по-английски → вручную перевести
ВАРИАНТ 3 — 1Step-EN+Ans (один запрос, видны промежуточные шаги):
"Переведи этот вопрос на английский, затем сразу ответь" → перевод + ответ
ВАРИАНТ 4 — TinT-EN ⭐ (один запрос, только ответ):
"Обработай вопрос внутренне на английском, покажи только финальный ответ на русском"
→ только результат
Все варианты работают в обычном чате, никакого кода не нужно.
Пример применения
Задача: Ты готовишься к переговорам с инвестором и хочешь разобраться в метриках оценки SaaS-стартапов — LTV, CAC, churn, Rule of 40. Модель по-русски даёт общие слова, без конкретики.
Промпт (TinT-EN):
Я задаю тебе вопрос по-русски, но ты должен обработать его внутренне на английском.
Промежуточные шаги не показывай — выдай только готовый ответ на русском.
Вопрос: Как инвесторы используют Rule of 40 для оценки SaaS-стартапов и где граница
между "нормой" и "красными флагами" по этому показателю?
Результат: Модель генерирует ответ, используя более насыщенный английский слой знаний о SaaS-метриках. Ты получишь конкретный, структурированный ответ с числами и примерами — вместо расплывчатого «это показатель роста и прибыльности». Промежуточный «перевод в голове» не видишь — только финальный русский текст.
Почему это работает
LLM обучается на текстах из интернета. Английских текстов — несравнимо больше, они точнее и детальнее. Поэтому знание об одном и том же факте хранится на разных "глубинах" в зависимости от языка запроса. Русский — хороший язык, но английский слой всё равно богаче по специализированным темам: финансы, технологии, медицина, наука.
Модель умеет хорошо переключаться между языками внутри одного контекста — это проявляется, когда двуязычные люди в обычной речи перемежают слова разных языков. Именно это использует TinT: инструкция «думай по-английски» не заставляет модель «выполнять код» — она задаёт паттерн генерации, при котором внутренние цепочки рассуждений идут через более богатый английский слой.
Рычаги управления промптом: - Хочешь видеть промежуточный перевод → используй 1Step-EN+Ans вместо TinT - Хочешь максимальное качество и не жалко лишнего запроса → используй 2Step-EN - Для технических тем: подмешивай английские термины прямо в русский вопрос (code-mixing) — это тоже помогает, без явных инструкций про "думать по-английски"
Шаблон промпта
Я задаю тебе вопрос на русском, но обработай его внутренне на английском языке.
Промежуточный перевод не показывай. Выдай только финальный ответ на русском.
Вопрос: {вопрос}
Плейсхолдеры:
- {вопрос} — любой фактический, аналитический или технический вопрос на русском
Вариант с code-mixing (без явных инструкций):
Объясни {тема} — включая {английский_термин_1}, {английский_термин_2} и их связь с {контекст}.
Ответь на русском.
Пример: «Объясни unit economics для маркетплейса — включая LTV, CAC ratio и cohort analysis, применительно к Wildberries или Ozon.»
🚀 Быстрый старт — вставь в чат:
Вот шаблон TinT (Translate-in-Thought). Адаптируй под мою задачу: [твоя задача].
Задавай вопросы, чтобы заполнить поля.
Я задаю тебе вопрос на русском, но обработай его внутренне на английском языке.
Промежуточный перевод не показывай. Выдай только финальный ответ на русском.
Вопрос: {вопрос}
LLM спросит какая тема и какой формат нужен — потому что TinT особенно полезен для конкретных задач (факты, анализ, техническое объяснение), и ей нужно понять, где именно активировать «английский режим».
Ограничения
⚠️ Высокоресурсные языки: Для русского выигрыш будет меньше, чем для ассамского или телугу — русский и так неплохо представлен в обучающих данных. Но на узкоспециализированных темах разница заметна.
⚠️ Маленькие модели: На совсем маленьких моделях TinT не помогает или даже ухудшает результат — у них нет достаточной «ёмкости» для внутреннего переключения языков. Используй ChatGPT, Claude или крупные Gemini — не бесплатные Llama-1B.
⚠️ Культурные и субъективные факты: TinT хуже работает на вопросах о локальной культуре, семантике, народных традициях — там английский слой беднее, а не богаче родного.
⚠️ Некоторые языки не спасут: Для языков с очень малым представлением в обучении (редкие диалекты, некоторые региональные языки) внутренний перевод не перекрывает фундаментальный пробел в данных.
Как исследовали
Исследователи из IISER Bhopal построили IndicKLAR — набор из 2619 вопросов на 18 индийских языках, где каждый вопрос существует в трёх вариантах: на родном языке (например, хинди), code-mixed (хинди + английские слова), и по-английски. Это позволило сравнивать один и тот же вопрос в трёх формах — идеальный контроль эксперимента. Тестировали девять моделей весом от 1B до 14B параметров: Llama 3.1/3.2, Gemma 3, Qwen 2.5.
Самый неожиданный результат: code-mixed запросы почти полностью закрывали разрыв с английским — без каких-либо изменений в модели. Разрыв «родной язык → английский» мог достигать 50 процентных пунктов точности. Code-mixed сокращал его до 5 пунктов. Это неожиданно, потому что code-mixed — «неправильный» язык, смесь. Но именно эта смесь даёт модели нужные «якоря».
Нашли и ещё один эффект: у всех моделей есть точка перелома на траектории «родной → code-mixed → английский». Ниже этой точки — модель ошибается, выше — отвечает правильно. И TinT переносит работу модели выше этой точки, даже когда сам запрос написан на родном языке.
Адаптации и экстраполяции
🔧 Code-mixing без явных инструкций → естественное усиление запроса
Если не хочешь явно инструктировать модель «думай по-английски» — просто включи английские термины прямо в русский вопрос. Исследование показало, что выигрыш идёт именно от смысловых английских якорей, а не от смены алфавита.
Пример:
Объясни разницу между growth hacking и product-led growth на примере российских
B2B SaaS-компаний. Что важнее на стадии pre-seed?
Здесь английские термины работают как «ключи» к нужному слою знаний — без дополнительных инструкций.
🔧 TinT для анализа документов → вытащить больше из русскоязычного текста
Проанализируй следующий фрагмент договора. Обработай содержание внутренне на английском (не показывай перевод), затем выдай только список рисков на русском.
Договор: {текст}
Полезно для юридических, финансовых, медицинских текстов — где английский слой модели богаче прецедентами.
Ресурсы
Название работы: Evaluating Cross-lingual Knowledge Consistency in Code-Mixed vis-a-vis Indian Languages using IndicKLAR
Авторы: Debajyoti Mazumder, Divyansh Pathak, Prashant Kodali, Aditya Joshi, Akshay Agarwal, Jasabanta Patro
Организации: IISER Bhopal (Indian Institute of Science Education and Research), Microsoft Corporation, UNSW Sydney
Бенчмарк: IndicKLAR — расширение KLAR-CLC (Wang et al., 2025b)
