3,583 papers
arXiv:2606.09338 72 8 июня 2026 г. FREE

Разрыв составного мышления: модель знает каждый факт, но не соединяет их без явной подсказки

КЛЮЧЕВАЯ СУТЬ
Парадокс: модель знает, кто лучший друг Зидана. И знает, когда родился Тьерри Анри. Но спроси «когда родился друг Зидана?» — ответит неправильно. Метод явной декомпозиции позволяет получать правильные ответы на цепочные вопросы — где нужно сначала найти «мост» между фактами, а потом использовать его. Пишешь «шаг 1: назови X, шаг 2: ответь про X» — модель перестаёт угадывать связующий факт и идёт по явной цепочке. Промежуточное звено оказывается в тексте — и дальше всё работает, без какого-либо дообучения.
Адаптировать под запрос

TL;DR

Если спросить модель «Когда родился лучший друг Зидана?» — она может ответить неправильно, даже если на вопросы «Кто лучший друг Зидана?» и «Когда родился Тьерри Анри?» отвечает верно. Это не пробел в знаниях — факты есть в модели. Это структурный сбой: в обучающих текстах эти факты никогда не встречались вместе, поэтому модель не умеет их автоматически соединять.

Главный инсайт: модель хранит факты как отдельные острова, не как связанную карту. Вопрос «когда родился друг X» требует сначала найти имя друга, потом найти дату рождения — два шага в одном. Но модель пытается ответить «с наскока», без этих промежуточных шагов, и промахивается. Это не вопрос размера модели или мощности — разрыв сохраняется даже у самых крупных LLM.

Практический вывод: любой вопрос, где ответ требует цепочки из двух и более фактов, нужно явно разбивать на шаги. Назвать промежуточную сущность вслух — и ответ резко улучшается. Именно это и делает Chain-of-Thought: он не просто «думает медленнее», он вытаскивает промежуточные звенья в явный текст.


🔬

Схема метода

Это исследование-находка, а не техника. Практический вывод оформляется как двухшаговая декомпозиция вопроса:

ШАГ 1: Явный вопрос о промежуточной сущности 
        → получить имя/объект/факт-связку

ШАГ 2: Вопрос с уже названной сущностью 
        → получить финальный ответ

Оба шага могут быть в одном промпте — нужно просто явно прописать структуру: «сначала определи X, затем ответь про X».


🚀

Пример применения

Задача: Готовишься к переговорам. Хочешь узнать про опыт инвестора, который вложился в конкурента.

Плохо — неявный цепочный вопрос:

Какой инвестиционный бэкграунд у основного инвестора VK?

Модель может ошибиться или смешать инвесторов, потому что пытается ответить «в лоб» без промежуточного шага.

Хорошо — явная декомпозиция:

Ответь пошагово — так мне важно видеть твой ход мысли:

Шаг 1: Кто является основным институциональным инвестором VK 
        (Mail.ru Group)? Назови конкретно: фонд или структуру.

Шаг 2: Опираясь на найденное в шаге 1 — какой инвестиционный 
        бэкграунд у этой структуры? Откуда деньги, в какие 
        сектора вкладывают, какие крупные сделки были?

Если по шагу 1 есть неопределённость — укажи это явно, 
не угадывай.

Результат: Модель сначала явно называет промежуточное звено (название структуры), затем отвечает про него. Вероятность правильного ответа резко выше — потому что промежуточный факт уже в тексте, а не «в голове» у модели.


🧠

Почему это работает

Проблема: Модель не «вычисляет» ответы — она генерирует текст по паттернам из обучающих данных. Если два факта никогда не встречались рядом в обучении, модель не знает как их «подтянуть» одновременно в один ответ. Даже если оба факта доступны — соединить их без подсказки невозможно.

Что умеет модель хорошо: Находить следующий токен по контексту. Если в тексте уже написано «друг Зидана — Тьерри Анри», то вопрос «когда родился Тьерри Анри?» модель решает легко — факт в контексте. Явное промежуточное звено в тексте = готовая подсказка для следующего шага.

Как это использовать: Декомпозиция выводит промежуточные звенья в явный текст. Модель больше не пытается угадать ответ «с наскока» — она следует по шагам, и каждый шаг создаёт контекст для следующего. Chain-of-Thought работает именно by this mechanism — не потому что модель «думает лучше», а потому что промежуточные результаты становятся частью входных данных для следующего шага.

Рычаги управления: - Явное требование назвать промежуточную сущность → самый важный рычаг. Фраза «назови конкретно» или «сначала определи X» кардинально улучшает точность - «Если неопределённость — скажи» → защита от уверенного галлюцинирования на сложных цепочках - Количество шагов → для трёхзвенных вопросов пиши три явных шага, не два - Разбивка на отдельные сообщения → для критически важных запросов задай вопрос о промежуточной сущности отдельным сообщением, убедись в ответе, затем задай финальный вопрос


📋

Шаблон промпта

Ответь пошагово:

Шаг 1: {промежуточный вопрос — кто/что является связующим звеном?}
Назови конкретно: {что именно нужно назвать}.

Шаг 2: Опираясь на ответ из шага 1 — {финальный вопрос про найденную сущность}.

Если в шаге 1 есть неопределённость — укажи это явно, не угадывай.

Что подставлять: - {промежуточный вопрос} — вопрос о «мосте»: кто владелец, кто основатель, что является причиной, и т.д. - {что именно нужно назвать} — уточни формат ответа: имя, название компании, дата, событие - {финальный вопрос} — то, что тебе на самом деле нужно знать

Примеры промежуточных вопросов: - «Кто является CEO компании X?» → «Какое образование у этого человека?» - «Какая технология лежит в основе продукта Y?» → «Какие ограничения у этой технологии?» - «Кто инвестировал в стартап Z?» → «Какие ещё стартапы они поддерживали?»


🚀 Быстрый старт — вставь в чат:

Вот шаблон двухшаговой декомпозиции для сложных вопросов. 
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит, какое промежуточное звено тебе нужно найти и что именно хочешь узнать в итоге — потому что без этого нельзя правильно разбить вопрос на шаги.


⚠️

Ограничения

⚠️ Не панацея для всех ошибок: Декомпозиция помогает при цепочных фактах, но не при галлюцинациях об отдельных фактах. Если модель не знает базового факта — разбивка на шаги не поможет.

⚠️ Длинные цепочки сложнее: Трёх- и четырёхзвенные вопросы требуют столь же длинной декомпозиции. Если цепочка сложная — лучше разбить на отдельные сообщения.

⚠️ Актуальные факты вне зоны действия: Если промежуточный факт произошёл после даты обучения модели — никакая декомпозиция не поможет. Проверяй актуальность данных отдельно.

⚠️ Исследование на синтетических данных: Эксперименты проводились на специально созданных биографиях, а не на реальных текстах интернета. Настоящие LLM обучены на огромном количестве связанных текстов — поэтому эффект может быть слабее при известных сущностях. Чем менее известна тема, тем важнее явная декомпозиция.


🔍

Как исследовали

Исследователи создали 100 000 искусственных биографий с атрибутами (дата рождения, город, университет, работа) и добавили отношения «друг» и «враг» между людьми. Затем строго разделили популяцию: половина людей видела цепочные контексты при обучении («друг Маркуса — Делия, Делия родилась в Эшфорде»), вторая половина — никогда. Потом проверили: может ли модель ответить на «в каком городе родился друг Маркуса?» без подсказки.

Результат был жёстким: при 97% точности на одиночных вопросах точность на двойных вопросах падала почти до нуля для «невидимой» группы — и никакие эксперименты с данными это не исправляли. Интересно, что явные форматы («друг Маркуса — Делия Крейн, Делия родилась в Эшфорде») помогали модели найти промежуточную сущность, но не улучшали итоговую точность сами по себе. Лучше всего работали неявные структурированные форматы (что-то вроде «Маркус → friend.birthcity → Эшфорд») — потому они лучше имитируют реальные вопросы, где промежуточная сущность скрыта. Это подтвердило главный вывод: проблема не в том, сколько у модели параметров, а в том, встречала ли она сущность в цепочном контексте при обучении.


📄

Оригинал из исследования

Format          | Example sequence
----------------|--------------------------------------------------
1-hop NL        | Marcus Halloway was born on June 14, 1967. 
                | He studied Linguistics at Northgate University.
                |
NL 2-hop        | Marcus Halloway's friend was born in Ashford.
implicit        |
                |
NL 2-hop        | Marcus Halloway's friend Delia Crane was born 
explicit        | in Ashford.
                |
RDF 2-hop       | [ENTITY] Marcus Halloway [RELATION] 
implicit        | friend.birthcity [VALUE] Ashford
                |
RDF 2-hop       | [ENTITY] Marcus Halloway [RELATION] friend 
explicit        | [VALUE] Delia Crane [RELATION] birthcity 
                | [VALUE] Ashford

Контекст: Так выглядят форматы обучающих данных, которые тестировали. Самый эффективный — неявный RDF (строчка 4): он прячет промежуточную сущность и заставляет модель учиться «собирать» ответ самостоятельно. Это же объясняет, почему явная декомпозиция в промпте так помогает — она воспроизводит логику, которую модели пришлось бы выучить при обучении.


💡

Адаптации и экстраполяции

📌

💡 Адаптация для проверки ответов модели

Когда модель уверенно отвечает на сложный вопрос — попроси её показать промежуточные шаги. Это встроенная проверка: если промежуточное звено неверное, финальный ответ тоже неверный, но ты это увидишь.

Ответь на вопрос: {твой сложный вопрос}

Но сначала — явно назови все промежуточные факты, 
на которые ты опираешься, прежде чем дать финальный ответ.
Формат:
- Промежуточный факт 1: ...
- Промежуточный факт 2: ...
- Финальный ответ: ...

📌

🔧 Техника: разбивка на отдельные сообщения → максимальная точность

Для критически важных вопросов не объединяй шаги в один промпт — задавай их последовательно:

Сообщение 1:

Кто является {промежуточная сущность}? 
Ответь только этим — имя, название, факт.

Убедись в ответе. Если сомневаешься — проверь.

Сообщение 2 (только после подтверждения):

Хорошо. Теперь: {финальный вопрос про названную сущность}

Это работает лучше одного промпта, потому что ты сам верифицируешь промежуточное звено — и модель работает с проверенным фактом в контексте, а не пытается угадать его внутри одного запроса.


🔗

Ресурсы

Название работы: Multi-Hop Knowledge Composition is Bound by Pretraining Exposure

Авторы: Yannis Karmim, Luis Marti, Djamé Seddah, Valentin Barrière

Организации: Inria (Париж и Чили), Universidad de Chile

Код: https://tinyurl.com/MHKComposition

Связанные работы: Press et al. (2023) — "Measuring and Narrowing the Compositionality Gap"; Allen-Zhu & Li (2024) — "Physics of Language Models: Knowledge Storage and Extraction"


📋 Дайджест исследования

Ключевая суть

Парадокс: модель знает, кто лучший друг Зидана. И знает, когда родился Тьерри Анри. Но спроси «когда родился друг Зидана?» — ответит неправильно. Метод явной декомпозиции позволяет получать правильные ответы на цепочные вопросы — где нужно сначала найти «мост» между фактами, а потом использовать его. Пишешь «шаг 1: назови X, шаг 2: ответь про X» — модель перестаёт угадывать связующий факт и идёт по явной цепочке. Промежуточное звено оказывается в тексте — и дальше всё работает, без какого-либо дообучения.

Принцип работы

Модель не вычисляет ответы — она предсказывает следующее слово по тексту. Если промежуточный факт уже написан явно — он становится входными данными для следующего шага. Это как шпаргалка прямо на экзамене: написал нужное имя — и дальше просто ответить про конкретного человека. Без явного промежуточного звена модель прыгает сразу к финальному ответу — и промахивается. Пошаговая структура убирает этот прыжок.

Почему работает

Два факта в модели — это два острова. В обучающих текстах они почти никогда не стояли рядом. Поэтому модель не умеет их автоматически соединять в один ответ. Причём это не лечится размером: разрыв сохраняется даже у самых крупных моделей. Когда пишешь промежуточный шаг явно — факт оказывается в контексте, а не где-то внутри весов модели. Дальше ей остаётся ответить на прямой вопрос про уже названную сущность. Именно поэтому пошаговые рассуждения (Chain-of-Thought) вообще работают — не потому что модель «думает медленнее», а потому что промежуточные результаты попадают в текст и тянут за собой следующий шаг.

Когда применять

Разведка перед переговорами — узнать про инвестора конкурента, историю генерального директора, предысторию сделки. Исследование: «какие технологии использует компания X и каковы их ограничения?». Любой вопрос с невидимым «мостом»: сначала нужно найти кто или что является связующим звеном, затем узнать про него. НЕ подходит: если базовый факт модель просто не знает или событие произошло после даты её обучения — декомпозиция не поможет. И не спасёт от галлюцинаций про отдельные факты — только про цепочки.

Мини-рецепт

1. Найди мост: Спроси себя — что нужно знать сначала, чтобы ответить на главный вопрос? Вопрос «чем известен инвестор конкурента?» требует сначала найти имя инвестора — это и есть мост.
2. Напиши шаг 1 с требованием назвать конкретно: «Шаг 1: кто является основным инвестором компании X? Назови конкретно — имя человека или название фонда».
3. Напиши шаг 2 с явной отсылкой к шагу 1: «Шаг 2: опираясь на найденное в шаге 1 — какие крупные сделки и в каких секторах у этой структуры были?».
4. Добавь защиту от уверенной выдумки: «Если в шаге 1 есть неопределённость — скажи об этом, не угадывай».
5. Для длинных цепочек — больше шагов: Три звена = три явных шага в промпте. Для критически важного запроса — задавай каждый шаг отдельным сообщением и проверяй ответ перед следующим.

Примеры

[ПЛОХО] : Какой инвестиционный опыт у основного акционера Яндекса?
[ХОРОШО] : Ответь пошагово: Шаг 1: Кто является основным акционером Яндекса прямо сейчас? Назови конкретно: имя человека или название фонда. Шаг 2: Опираясь на найденное в шаге 1 — какие крупные сделки и в каких секторах у этой структуры были за последние несколько лет? Если в шаге 1 есть неопределённость — скажи об этом явно, не угадывай.
Источник: Multi-Hop Knowledge Composition is Bound by Pretraining Exposure
ArXiv ID: 2606.09338 | Сгенерировано: 2026-06-09 05:35

Проблемы LLM

ПроблемаСутьКак обойти
Модель знает оба факта, но не соединяет их в одном ответеСпрашиваешь «Когда родился друг Зидана?». Модель знает кто друг Зидана. Знает когда этот человек родился. Но на составной вопрос отвечает неверно. Причина: в обучающих текстах эти два факта никогда не стояли рядом. Модель не умеет соединять то, что никогда не встречала вместе. Проблема не уходит с ростом размера моделиСделай промежуточный шаг явным текстом. Сначала попроси назвать промежуточную сущность. Потом — задай вопрос про неё. Модель не может соединить факты «в уме», но легко отвечает когда первый факт уже написан в тексте

Методы

МетодСуть
Явное называние промежуточной сущности — точность на составных вопросахРаздели вопрос на два шага в одном запросе. Шаг 1: назови конкретно [кто/что является связующим звеном]. Шаг 2: опираясь на ответ шага 1 — [финальный вопрос]. Ключевое слово: «назови конкретно» — это заставляет модель вписать промежуточный факт в текст. Дальше он становится частью контекста и модель отвечает уже как на простой вопрос. Добавь: «если в шаге 1 есть неопределённость — скажи явно». Это снижает риск уверенной ошибки. Когда применять: вопрос требует сначала найти «мост» (владелец, основатель, причина, автор), затем спросить про него. Не помогает: модель не знает базового факта вообще, или факт появился после даты обучения

Тезисы

ТезисКомментарий
Чем менее известна тема — тем важнее явная декомпозицияМодель соединяет факты через паттерны из обучающих текстов. Про известных людей и крупные компании таких текстов много — факты часто стояли рядом. Про нишевые темы, редкие компании, малоизвестных людей — почти никогда. Поэтому на нишевых темах провал на составных вопросах сильнее. Применяй: чем менее известна сущность в вопросе, тем строже требуй явный промежуточный шаг. Для известных фактов цепочка работает сама. Для нишевых — без явной декомпозиции почти гарантированная ошибка
📖 Простыми словами

Multi-Hop Knowledge Composition is Bound by Pretraining Exposure

arXiv: 2606.09338

Нейросети не умеют думать логически — они просто очень круто предсказывают следующее слово на основе того, что видели раньше. Проблема Multi-Hop Knowledge Composition в том, что модель может знать факт А и факт Б по отдельности, но оказывается абсолютно беспомощной, когда нужно их соединить. Это не склероз, а структурный барьер: если в обучающей выборке эти данные не стояли рядом, для ИИ их связи просто не существует. Модель не «вычисляет» ответ в голове, она ищет знакомый текстовый маршрут, и если дорога между фактами не проложена, она просто теряется.

Это как если бы ты знал адрес крутого бара и знал, как доехать до центра города, но не мог сообразить, как попасть в бар из центра, потому что всегда ездил туда только из дома. Формально знания есть, но навигатор в голове не может построить новый маршрут на лету. Ты стоишь посреди площади и тупишь, хотя все нужные карты у тебя в кармане. Модель ведет себя так же: она выдает галлюцинации или ошибку не от тупости, а потому что в её «карте мира» эти точки никогда не соединялись линией.

Исследователи доказали это на простых цепочках: спроси модель про друга Зидана и дату его рождения по отдельности — ответит без запинки. Но стоит объединить их в один вопрос, и система ломается. Чтобы это починить, нужно использовать двухшаговую декомпозицию. Вместо того чтобы ждать от ИИ чуда дедукции, нужно заставить его сначала вытащить промежуточный факт (кто этот друг?), а уже потом на его основе искать ответ. Только так можно пробить этот барьер предобучения, когда модель буквально не видит связи, пока ты не ткнешь её в неё носом.

Этот принцип универсален и касается не только футболистов или инвесторов. Он объясняет, почему LLM лажают в сложной аналитике, юридических тонкостях или кодинге, где решение зависит от нескольких условий. 10 из 10 моделей спотыкаются на неявных связях. Если ты просишь нейронку проанализировать влияние закона Х на компанию Y, а в интернете нет готовой статьи об этом, модель скорее всего выдаст чушь. Она не свяжет их сама, пока ты не заставишь её выписать сначала суть закона, потом структуру компании, и только в конце — сопоставить их.

Короче, забудь про иллюзию «разумности» ИИ — это просто гигантская библиотека, где книги не умеют разговаривать друг с другом. Главный вывод: если задача требует больше одного логического шага, дроби запрос на части. Не надейся, что модель сама «догадается» соединить точки, которые она видела в разных концах интернета. Либо ты строишь мост между фактами вручную, либо получаешь уверенный бред вместо ответа. Логика — это твоя работа, а не нейросети.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с