3,583 papers
arXiv:2605.20128 76 19 мая 2026 г. FREE

PRCP (Potential Relation Completion Prompting): трёхшаговая техника против туннельного зрения LLM

КЛЮЧЕВАЯ СУТЬ
Дай LLM договор и попроси найти риски — получишь список очевидного. Скрытые сигналы, которые лежат прямо в тексте, она проигнорирует: явный вопрос перетягивает всё внимание на себя. PRCP позволяет восстанавливать скрытые причинно-следственные связи — те, что модель отсекает при обычном анализе как нерелевантные. Фишка: до ответа на вопрос заставь модель задать вопросы к каждому предложению — прямой («что из этого следует?») и обратный («что к этому привело?»). Потом отбери нужные, и только тогда — ответ. Принудительное сканирование вместо кратчайшего пути.
Адаптировать под запрос

TL;DR

LLM страдает туннельным зрением: когда ты даёшь явную задачу ("найди главную мысль", "оцени риски"), модель концентрируется на ней и перестаёт замечать косвенные сигналы, которые лежат прямо в тексте. Прочитает про долгую пешую прогулку и не свяжет это с появившимися на следующий день волдырями — хотя связь очевидна.

Это явление называется inattentional blindnessизбирательная слепота: в человеческой психологии известно с 1999 года (опыт с невидимой гориллой). У LLM та же проблема. Когда есть явный вопрос, модель отвечает на него, игнорируя скрытые причинно-следственные связи в контексте. Не потому что не умеет — а потому что явная инструкция перетягивает внимание.

PRCP решает это за три шага: сначала модель генерирует вопросы к каждому предложению текста (что из этого следует? что к этому привело?), затем отбирает только те, что нужны для ответа, и финально отвечает — уже с восстановленными скрытыми связями. Это как попросить эксперта сначала «прочитать между строк», а потом давать заключение.


🔬

Схема метода

Все три шага выполняются в одном промпте.

ШАГ 1: Генерация вопросов
  → Для каждого предложения: прямой вопрос (что следует?) 
    + обратный вопрос (что привело к этому?)

ШАГ 2: Отбор вопросов
  → Выбрать предложения, требующие доп. объяснения 
    для ответа на главный вопрос
  → Оставить только релевантные вопросы из Шага 1

ШАГ 3: Итоговый вывод
  → Ответить на главный вопрос, используя 
    восстановленные связи из Шагов 1 и 2

🚀

Пример применения

Задача: Ты — СМО стартапа, читаешь отзыв бета-пользователя на новый сервис доставки. Явная задача: "Доволен или нет?". Но тебе важно понять скрытые сигналы — что реально не так в продукте.

Отзыв пользователя:

"Заказал в пятницу вечером, привезли в субботу утром — быстро. Курьер позвонил заранее. Упаковка была немного мятой, но внутри всё цело. Я уже третий раз пользуюсь сервисом, и каждый раз что-нибудь мелкое, но замечаешь. Цена нормальная для такого уровня. Друзьям не рекомендовал, пока не разберусь что к чему."

Промпт:

Прочитай отзыв и выполни три шага:

ШАГ 1 — Вопросы к каждому предложению:
Для каждого предложения сгенерируй:
- Прямой вопрос: что из этого следует или что произойдёт дальше?
- Обратный вопрос: что могло привести к тому, что написано?

ШАГ 2 — Отбор:
Выбери предложения, которые содержат скрытые сигналы 
о проблемах с продуктом. Оставь только вопросы 
из Шага 1, которые помогают ответить на главный вопрос.

ШАГ 3 — Вывод:
Используя выбранные вопросы и ответы на них, 
ответь: какие скрытые проблемы с сервисом 
стоит проверить прямо сейчас?

ОТЗЫВ:
[вставить текст]

Результат: Модель покажет анализ по всем трём шагам. В Шаге 1 — вопросы к каждому предложению: например, к "каждый раз что-нибудь мелкое" — "что именно повторяется? системная ли это проблема?". В Шаге 2 — отберёт предложения с косвенными сигналами (мятая упаковка → системная проблема хранения? "третий раз" + "не рекомендовал" → лояльный, но не адвокат бренда). В Шаге 3 — конкретный список скрытых проблем, которые не видны при поверхностном анализе тональности.


🧠

Почему это работает

Слабость LLM: Модель оптимизирована отвечать на вопрос кратчайшим путём. Явная инструкция ("найди риски", "оцени качество") создаёт фокус, который буквально закрывает боковое зрение: косвенные связи, которые не ведут напрямую к ответу, отсекаются как нерелевантные. Chain-of-Thought здесь помогает слабо — он улучшает логику рассуждений, но не расширяет охват внимания.

Сильная сторона LLM: Модель отлично генерирует вопросы к тексту — она понимает причинно-следственные структуры. Если явно попросить её поработать с каждым предложением отдельно и сформулировать "что из этого следует / что к этому привело", она справляется хорошо. Проблема не в способности видеть связи, а в том, что без явного запроса она их не ищет.

Как метод использует это: PRCP принудительно переключает модель в режим «медленного чтения» до того, как она начнёт отвечать. Генерация вопросов к каждому предложению — это не просто рефлексия, это принудительное сканирование всего текста. Шаг отбора добавляет фильтр релевантности — иначе модель утонет в нерелевантных вопросах. Только после этого она выходит на финальный ответ — уже с восстановленными скрытыми связями.

Рычаги управления:

Элемент Что можно менять Эффект
"Для каждого предложения" Заменить на "для каждого абзаца" Быстрее, для длинных текстов
Прямой + обратный вопрос Добавить "кто выигрывает от этого?" Под задачи анализа интересов
Шаг отбора Убрать Видишь все связи, но больше шума
Главный вопрос Поставить несколько вопросов Многоаспектный анализ

📋

Шаблон промпта

Прочитай {текст} и выполни три шага:

ШАГ 1 — Генерация вопросов:
Для каждого предложения в тексте сформулируй два вопроса:
- Прямой: что из этого следует или что произойдёт дальше?
- Обратный: что могло привести к тому, что здесь написано?

ШАГ 2 — Отбор:
Просмотри текст ещё раз. Выбери предложения, 
которые требуют дополнительного объяснения 
для ответа на главный вопрос. 
Оставь только вопросы из Шага 1, 
относящиеся к этим предложениям.

ШАГ 3 — Вывод:
Используя выбранные вопросы и ответы на них, 
ответь на главный вопрос: {вопрос}

ТЕКСТ:
{текст}

Плейсхолдеры: - {текст} — любой текст с неочевидными связями: отзыв, договор, бриф, письмо, статья - {вопрос} — твоя явная задача: "какие риски?", "что реально имеет в виду автор?", "в чём скрытая проблема?"


🚀 Быстрый старт — вставь в чат:

Вот шаблон PRCP — метода для анализа текста с 
неочевидными связями. Адаптируй под мою задачу: 
{твоя задача}. Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит про текст для анализа и главный вопрос — потому что метод строится вокруг конкретного текста и конкретной задачи. Она возьмёт трёхшаговую структуру и адаптирует под твой контекст.


⚠️

Ограничения

⚠️ Короткие и простые тексты: Метод избыточен для прямых вопросов ("какова цена?", "кто автор?"). PRCP нужен только когда важны косвенные сигналы.

⚠️ Длинные тексты: Генерация вопросов к каждому предложению создаёт большой промежуточный вывод. Для текстов больше 500 слов — переключайся на режим "для каждого абзаца".

⚠️ Устойчивость: Даже с PRCP модели непоследовательны при одном и том же тексте с разными формулировками задач. Метод улучшает ситуацию, но не устраняет полностью.

⚠️ Субъективные задачи: Если "правильного" скрытого смысла нет (оценка эстетики, вкус), метод не поможет — нет объективных причинно-следственных связей для восстановления.


🔍

Как исследовали

Команда из UESTC (Китай) взяла готовый датасет коммонсенс-рассуждений, встроила в каждый пример скрытый вопрос прямо в контекст истории, а явный вопрос сделала отдельной инструкцией. Задача для LLM: выбрать вариант ответа, который правильно отвечает на оба — и явный, и скрытый. Это хитрая конструкция: ответить только на одно из двух — легко, интегрировать оба — сложно.

Результат удивил: лучшая модель (Gemini 2.5 Pro) дала 42.8% стабильности — то есть больше чем в половине случаев модель путалась, меняя ответ при перефразировке той же задачи. Chain-of-Thought помогал нестабильно — на одних моделях +2-3%, на других уходил в минус. PRCP давал стабильный плюс почти везде, причём шаг отбора вопросов (Шаг 2) критически важен: без него модель тонула в нерелевантных вопросах и результат был хуже.

Отдельно интересна ошибочная картина: явные задачи модели решали хорошо (86-92%), скрытые — заметно хуже (55-77%). Причём в 9-21% случаев модель вообще игнорировала скрытую информацию — не "неправильно рассуждала", а буквально не замечала. Это и есть туннельное зрение в действии.


📄

Оригинал из исследования

Task: Please select the story events that best align with the 
given context and conditional question from the four available 
event set options.

Context: [Story with embedded implicit information]

Event Set Options:
A) [Event answering Qexp + Event answering Qimp]     ← CORRECT
B) [Event answering Qexp + Contradictory to Qimp]   ← Explicit only
C) [Wrong for Qexp + Event answering Qimp]           ← Implicit only
D) [Event answering Qexp + Unrelated distractor]     ← Ignores implicit

Контекст: Базовый промпт задачи в бенчмарке MixRea. Каждый вариант ответа специально сконструирован так, чтобы диагностировать конкретный тип ошибки: B = модель видит явное, игнорирует скрытое; C = наоборот; D = явное плюс нерелевантная информация.


💡

Адаптации и экстраполяции

📌

1. Адаптация: анализ договора или ТЗ

💡 Для проверки документов: Тот же метод, но главный вопрос — "какие обязательства я беру, которые не написаны явно?"

ШАГ 1 — Для каждого пункта договора:
- Прямой вопрос: что из этого следует на практике?
- Обратный вопрос: при каком сценарии этот пункт 
  будет использован против меня?

ШАГ 2 — Выбери пункты, которые звучат нейтрально, 
но могут создать скрытые обязательства.

ШАГ 3 — Перечисли скрытые риски, 
о которых стоит спросить юриста.

ТЕКСТ ДОГОВОРА: {текст}

📌

2. Техника: Добавить явный вывод по каждому шагу

🔧 Добавь → запиши вывод после каждого шага → модель не просто генерирует промежуточные вопросы, но и отвечает на них. Это делает процесс прозрачным — ты видишь не только структуру, но и содержание рассуждений.

ШАГ 1 — Для каждого предложения сгенерируй вопросы 
И кратко ответь на каждый (1-2 слова).

ШАГ 2 — Выбери релевантные пары "вопрос → ответ".

ШАГ 3 — Собери финальный вывод из отобранных пар.

📌

3. Экстраполяция: комбо с ролевым фреймингом

Если задача требует разных углов зрения — назначь в Шаге 1 роли:

ШАГ 1 — Прочитай текст как [юрист / инвестор / конкурент].
Для каждого предложения задай вопрос с позиции этой роли.

PRCP находит скрытые связи, ролевой фрейминг задаёт направление поиска. Вместе — точнее, чем каждый метод отдельно.


🔗

Ресурсы

Название: MixRea: Benchmarking Explicit-Implicit Reasoning in Large Language Models

Код: https://anonymous.4open.science/r/MixRea

Авторы: Yuanqing Cai, Ziyi Huang, Minhao Liu, Lixin Duan, Wen Li, Yanru Zhang

Организация: Shenzhen Institute for Advanced Study, University of Electronic Science and Technology of China (UESTC)

Опыт-прецедент: Simons & Chabris (1999) — "Invisible Gorilla experiment", inattentional blindness


📋 Дайджест исследования

Ключевая суть

Дай LLM договор и попроси найти риски — получишь список очевидного. Скрытые сигналы, которые лежат прямо в тексте, она проигнорирует: явный вопрос перетягивает всё внимание на себя. PRCP позволяет восстанавливать скрытые причинно-следственные связи — те, что модель отсекает при обычном анализе как нерелевантные. Фишка: до ответа на вопрос заставь модель задать вопросы к каждому предложению — прямой («что из этого следует?») и обратный («что к этому привело?»). Потом отбери нужные, и только тогда — ответ. Принудительное сканирование вместо кратчайшего пути.

Принцип работы

Три шага переключают модель из режима «ответить быстро» в режим «медленное чтение». Шаг 1: сгенерируй два вопроса к каждому предложению — прямой и обратный. Это не рефлексия, это принудительный обход всего текста. Шаг 2: отбери вопросы, нужные для главного. Без фильтра — шум и потеря фокуса. Шаг 3: ответь, используя восстановленные связи. Модель не игнорирует связи потому что не видит — она игнорирует потому что не ищет. Три шага заставляют искать. Всё это работает в одном промпте. Никакого дообучения, никаких плагинов.

Почему работает

LLM идёт к ответу кратчайшим путём. Явная задача создаёт туннель — всё что не ведёт прямо к ответу, отсекается как мусор. Пошаговые рассуждения (chain-of-thought) здесь не спасают: они улучшают логику, но не расширяют охват. Фокус остаётся узким. Парадокс: модель отлично строит причинно-следственные связи, если явно попросить. Проблема не в умении — в том что без запроса она просто не ищет. PRCP превращает «найди скрытое» из неявной надежды в конкретный алгоритм. Явный запрос на вопросы к каждому предложению — это именно тот сигнал, которого модели не хватало.

Когда применять

Анализ текстов с неочевидными сигналами — особенно когда важно не «что написано», а «что имеется в виду». Отзывы клиентов → найти системные проблемы, а не общее настроение. Договоры и соглашения → скрытые риски в формулировках, особенно когда нужно понять как это сработает через полгода. Брифы и технические задания → что заказчик не написал, но явно имеет в виду. Деловые письма и переговоры → подтекст и реальные намерения за вежливыми словами. НЕ подходит для прямых фактических вопросов — если текст короткий и связи на поверхности, метод избыточен. Для текстов длиннее 500 слов меняй «для каждого предложения» на «для каждого абзаца» — иначе промежуточный вывод будет огромным.

Мини-рецепт

1. Возьми шаблон: три шага с вопросами «что следует?» и «что привело?» — шаблон в исследовании готов к копированию.
2. Подставь текст: отзыв, договор, письмо, бриф — любой текст где важны косвенные сигналы.
3. Сформулируй главный вопрос конкретно: не «оцени текст», а «какие скрытые проблемы?», «что реально имеет в виду автор?», «что может сработать против меня?»
4. Если текст длинный: замени «для каждого предложения» на «для каждого абзаца» — скорость вырастет, шум упадёт.
5. Шаг 2 не выбрасывай: без отбора модель утонет в нерелевантных вопросах и потеряет фокус.

Примеры

[ПЛОХО] : Найди риски в этом договоре аренды — Модель выдаст очевидное: «проверьте срок», «уточните депозит». Скрытые противоречия в формулировках останутся незамеченными.
[ХОРОШО] : Прочитай договор аренды и выполни три шага. ШАГ 1 — Вопросы к каждому предложению: — Прямой: что из этого следует или что произойдёт дальше? — Обратный: что могло привести к тому, что здесь написано? ШАГ 2 — Отбор: Выбери предложения, которые требуют объяснения для ответа на главный вопрос. Оставь только вопросы из Шага 1, относящиеся к этим предложениям. ШАГ 3 — Вывод: Ответь: какие формулировки договора могут сработать против меня через полгода? ДОГОВОР: [текст] — Модель пройдёт по каждому предложению, вскроет косвенные риски в формулировках («арендодатель вправе изменить условия» + «уведомление за 3 дня» = можно поднять цену почти без предупреждения) — и выдаст список того, что при беглом чтении не заметишь.
Источник: MixRea: Benchmarking Explicit-Implicit Reasoning in Large Language Models
ArXiv ID: 2605.20128 | Сгенерировано: 2026-05-20 06:23

Проблемы LLM

ПроблемаСутьКак обойти
Явная задача блокирует поиск косвенных связейДаёшь модели чёткий вопрос ("найди риски", "оцени качество"). Модель идёт кратчайшим путём к ответу. По дороге отбрасывает всё что напрямую к ответу не ведёт. Косвенные сигналы в тексте остаются невидимыми. Не потому что модель не умеет их видеть. А потому что явная инструкция отвлекла внимание. Это системная проблема для любого анализа текста с неочевидными связями: отзывы, письма, договоры, брифыСначала попроси модель задать вопросы к каждому предложению — что из него следует и что к нему привело. Только потом — ответить на твой вопрос. Это переключает модель в режим сканирования текста до формирования ответа

Методы

МетодСуть
Принудительное сканирование — достать скрытые связи из текстаТри шага в одном запросе.

Шаг 1 — Вопросы к каждому предложению. Попроси написать два вопроса для каждого предложения: прямой ("что из этого следует?") и обратный ("что к этому привело?").

Шаг 2 — Отбор. Попроси выбрать только те предложения, которые важны для твоего главного вопроса. Лишние вопросы убрать.

Шаг 3 — Вывод. Ответить на главный вопрос с опорой на найденные связи.

Шаблон: Прочитай {текст} и выполни три шага: [Ш1] для каждого предложения — прямой вопрос (что следует?) и обратный (что привело?); [Ш2] выбери предложения нужные для ответа на {вопрос}, оставь только их вопросы; [Ш3] ответь на {вопрос} используя найденные связи

Почему работает. Без Шага 1 модель сразу оптимизирует под ответ. С Шагом 1 — вынуждена пройти по каждому предложению. Шаг 2 добавляет фильтр: без него модель тонет в нерелевантных вопросах.

Когда применять: текст с неочевидными связями — отзывы, письма, договоры, брифы. Нужно понять что "между строк".
Когда не применять: прямые фактические вопросы ("кто автор?", "какая цена?"). Тексты больше 500 слов — меняй "для каждого предложения" на "для каждого абзаца"
📖 Простыми словами

MixRea: Benchmarking Explicit-Implicit Reasoning inLargeLanguageModels

arXiv: 2605.20128

Проблема современных нейросетей в том, что у них развито туннельное зрение. Когда ты даешь модели конкретную задачу, она вцепляется в нее мертвой хваткой и напрочь игнорирует все, что происходит на периферии. Это фундаментальный баг архитектуры: LLM обучены находить кратчайший путь к ответу, поэтому они отсекают любые косвенные сигналы как информационный мусор. В итоге модель видит текст, но не считывает контекст, который буквально кричит о себе между строк.

Это похоже на то, как ты просишь друга проверить, не подгорела ли яичница, а он послушно кивает, пока на кухне вовсю заливает соседей. Друг честно выполнил инструкцию — яйца в порядке, — но проигнорировал катастрофу, потому что ты о ней не спрашивал. Модель ведет себя так же: она может прочитать рассказ о долгой прогулке и жалобы на боль в ногах, но не свяжет их воедино, если ты прямо не спросишь про мозоли.

Чтобы вылечить этот облом, исследователи придумали MixRea — метод, который заставляет нейронку работать в режиме «3 в 1». Вместо того чтобы просто отвечать на вопрос, модель обязана сначала вытащить все явные факты, затем раскопать скрытые связи и только потом выдать вердикт. Это не просто Chain-of-Thought, который учит модель думать по шагам, а полноценное расширение «бокового зрения». Например, если ты СМО и просишь оценить отзыв клиента, модель не просто скажет «он доволен», а подметит, что юзер упомянул долгую загрузку, хотя прямо на нее не жаловался.

Этот подход — спасение для любой аналитики, от маркетинга до юриспруденции. Тестировали метод на сложных логических задачах, но принцип универсален: везде, где нужно читать между строк, стандартные промпты лажают. Будь то анализ рисков в договоре или поиск багов в коде по косвенным признакам, MixRea заставляет AI перестать быть прямолинейным роботом и начать замечать детали, которые раньше улетали в корзину.

Короче, хватит надеяться, что нейронка сама «догадается» о скрытых смыслах — она слишком ленива для этого. Нужно внедрять явное извлечение скрытых связей в каждый серьезный промпт, иначе ты будешь получать плоские ответы, пока важные инсайты остаются незамеченными. Либо ты заставляешь модель смотреть по сторонам, либо она продолжает выдавать формально правильную, но бесполезную фигню.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с