TL;DR
LLM страдает туннельным зрением: когда ты даёшь явную задачу ("найди главную мысль", "оцени риски"), модель концентрируется на ней и перестаёт замечать косвенные сигналы, которые лежат прямо в тексте. Прочитает про долгую пешую прогулку и не свяжет это с появившимися на следующий день волдырями — хотя связь очевидна.
Это явление называется inattentional blindness — избирательная слепота: в человеческой психологии известно с 1999 года (опыт с невидимой гориллой). У LLM та же проблема. Когда есть явный вопрос, модель отвечает на него, игнорируя скрытые причинно-следственные связи в контексте. Не потому что не умеет — а потому что явная инструкция перетягивает внимание.
PRCP решает это за три шага: сначала модель генерирует вопросы к каждому предложению текста (что из этого следует? что к этому привело?), затем отбирает только те, что нужны для ответа, и финально отвечает — уже с восстановленными скрытыми связями. Это как попросить эксперта сначала «прочитать между строк», а потом давать заключение.
Схема метода
Все три шага выполняются в одном промпте.
ШАГ 1: Генерация вопросов
→ Для каждого предложения: прямой вопрос (что следует?)
+ обратный вопрос (что привело к этому?)
ШАГ 2: Отбор вопросов
→ Выбрать предложения, требующие доп. объяснения
для ответа на главный вопрос
→ Оставить только релевантные вопросы из Шага 1
ШАГ 3: Итоговый вывод
→ Ответить на главный вопрос, используя
восстановленные связи из Шагов 1 и 2
Пример применения
Задача: Ты — СМО стартапа, читаешь отзыв бета-пользователя на новый сервис доставки. Явная задача: "Доволен или нет?". Но тебе важно понять скрытые сигналы — что реально не так в продукте.
Отзыв пользователя:
"Заказал в пятницу вечером, привезли в субботу утром — быстро. Курьер позвонил заранее. Упаковка была немного мятой, но внутри всё цело. Я уже третий раз пользуюсь сервисом, и каждый раз что-нибудь мелкое, но замечаешь. Цена нормальная для такого уровня. Друзьям не рекомендовал, пока не разберусь что к чему."
Промпт:
Прочитай отзыв и выполни три шага:
ШАГ 1 — Вопросы к каждому предложению:
Для каждого предложения сгенерируй:
- Прямой вопрос: что из этого следует или что произойдёт дальше?
- Обратный вопрос: что могло привести к тому, что написано?
ШАГ 2 — Отбор:
Выбери предложения, которые содержат скрытые сигналы
о проблемах с продуктом. Оставь только вопросы
из Шага 1, которые помогают ответить на главный вопрос.
ШАГ 3 — Вывод:
Используя выбранные вопросы и ответы на них,
ответь: какие скрытые проблемы с сервисом
стоит проверить прямо сейчас?
ОТЗЫВ:
[вставить текст]
Результат: Модель покажет анализ по всем трём шагам. В Шаге 1 — вопросы к каждому предложению: например, к "каждый раз что-нибудь мелкое" — "что именно повторяется? системная ли это проблема?". В Шаге 2 — отберёт предложения с косвенными сигналами (мятая упаковка → системная проблема хранения? "третий раз" + "не рекомендовал" → лояльный, но не адвокат бренда). В Шаге 3 — конкретный список скрытых проблем, которые не видны при поверхностном анализе тональности.
Почему это работает
Слабость LLM: Модель оптимизирована отвечать на вопрос кратчайшим путём. Явная инструкция ("найди риски", "оцени качество") создаёт фокус, который буквально закрывает боковое зрение: косвенные связи, которые не ведут напрямую к ответу, отсекаются как нерелевантные. Chain-of-Thought здесь помогает слабо — он улучшает логику рассуждений, но не расширяет охват внимания.
Сильная сторона LLM: Модель отлично генерирует вопросы к тексту — она понимает причинно-следственные структуры. Если явно попросить её поработать с каждым предложением отдельно и сформулировать "что из этого следует / что к этому привело", она справляется хорошо. Проблема не в способности видеть связи, а в том, что без явного запроса она их не ищет.
Как метод использует это: PRCP принудительно переключает модель в режим «медленного чтения» до того, как она начнёт отвечать. Генерация вопросов к каждому предложению — это не просто рефлексия, это принудительное сканирование всего текста. Шаг отбора добавляет фильтр релевантности — иначе модель утонет в нерелевантных вопросах. Только после этого она выходит на финальный ответ — уже с восстановленными скрытыми связями.
Рычаги управления:
| Элемент | Что можно менять | Эффект |
|---|---|---|
| "Для каждого предложения" | Заменить на "для каждого абзаца" | Быстрее, для длинных текстов |
| Прямой + обратный вопрос | Добавить "кто выигрывает от этого?" | Под задачи анализа интересов |
| Шаг отбора | Убрать | Видишь все связи, но больше шума |
| Главный вопрос | Поставить несколько вопросов | Многоаспектный анализ |
Шаблон промпта
Прочитай {текст} и выполни три шага:
ШАГ 1 — Генерация вопросов:
Для каждого предложения в тексте сформулируй два вопроса:
- Прямой: что из этого следует или что произойдёт дальше?
- Обратный: что могло привести к тому, что здесь написано?
ШАГ 2 — Отбор:
Просмотри текст ещё раз. Выбери предложения,
которые требуют дополнительного объяснения
для ответа на главный вопрос.
Оставь только вопросы из Шага 1,
относящиеся к этим предложениям.
ШАГ 3 — Вывод:
Используя выбранные вопросы и ответы на них,
ответь на главный вопрос: {вопрос}
ТЕКСТ:
{текст}
Плейсхолдеры:
- {текст} — любой текст с неочевидными связями: отзыв, договор, бриф, письмо, статья
- {вопрос} — твоя явная задача: "какие риски?", "что реально имеет в виду автор?", "в чём скрытая проблема?"
🚀 Быстрый старт — вставь в чат:
Вот шаблон PRCP — метода для анализа текста с
неочевидными связями. Адаптируй под мою задачу:
{твоя задача}. Задавай вопросы, чтобы заполнить поля.
[вставить шаблон выше]
LLM спросит про текст для анализа и главный вопрос — потому что метод строится вокруг конкретного текста и конкретной задачи. Она возьмёт трёхшаговую структуру и адаптирует под твой контекст.
Ограничения
⚠️ Короткие и простые тексты: Метод избыточен для прямых вопросов ("какова цена?", "кто автор?"). PRCP нужен только когда важны косвенные сигналы.
⚠️ Длинные тексты: Генерация вопросов к каждому предложению создаёт большой промежуточный вывод. Для текстов больше 500 слов — переключайся на режим "для каждого абзаца".
⚠️ Устойчивость: Даже с PRCP модели непоследовательны при одном и том же тексте с разными формулировками задач. Метод улучшает ситуацию, но не устраняет полностью.
⚠️ Субъективные задачи: Если "правильного" скрытого смысла нет (оценка эстетики, вкус), метод не поможет — нет объективных причинно-следственных связей для восстановления.
Как исследовали
Команда из UESTC (Китай) взяла готовый датасет коммонсенс-рассуждений, встроила в каждый пример скрытый вопрос прямо в контекст истории, а явный вопрос сделала отдельной инструкцией. Задача для LLM: выбрать вариант ответа, который правильно отвечает на оба — и явный, и скрытый. Это хитрая конструкция: ответить только на одно из двух — легко, интегрировать оба — сложно.
Результат удивил: лучшая модель (Gemini 2.5 Pro) дала 42.8% стабильности — то есть больше чем в половине случаев модель путалась, меняя ответ при перефразировке той же задачи. Chain-of-Thought помогал нестабильно — на одних моделях +2-3%, на других уходил в минус. PRCP давал стабильный плюс почти везде, причём шаг отбора вопросов (Шаг 2) критически важен: без него модель тонула в нерелевантных вопросах и результат был хуже.
Отдельно интересна ошибочная картина: явные задачи модели решали хорошо (86-92%), скрытые — заметно хуже (55-77%). Причём в 9-21% случаев модель вообще игнорировала скрытую информацию — не "неправильно рассуждала", а буквально не замечала. Это и есть туннельное зрение в действии.
Оригинал из исследования
Task: Please select the story events that best align with the
given context and conditional question from the four available
event set options.
Context: [Story with embedded implicit information]
Event Set Options:
A) [Event answering Qexp + Event answering Qimp] ← CORRECT
B) [Event answering Qexp + Contradictory to Qimp] ← Explicit only
C) [Wrong for Qexp + Event answering Qimp] ← Implicit only
D) [Event answering Qexp + Unrelated distractor] ← Ignores implicit
Контекст: Базовый промпт задачи в бенчмарке MixRea. Каждый вариант ответа специально сконструирован так, чтобы диагностировать конкретный тип ошибки: B = модель видит явное, игнорирует скрытое; C = наоборот; D = явное плюс нерелевантная информация.
Адаптации и экстраполяции
1. Адаптация: анализ договора или ТЗ
💡 Для проверки документов: Тот же метод, но главный вопрос — "какие обязательства я беру, которые не написаны явно?"
ШАГ 1 — Для каждого пункта договора:
- Прямой вопрос: что из этого следует на практике?
- Обратный вопрос: при каком сценарии этот пункт
будет использован против меня?
ШАГ 2 — Выбери пункты, которые звучат нейтрально,
но могут создать скрытые обязательства.
ШАГ 3 — Перечисли скрытые риски,
о которых стоит спросить юриста.
ТЕКСТ ДОГОВОРА: {текст}
2. Техника: Добавить явный вывод по каждому шагу
🔧 Добавь
→ запиши выводпосле каждого шага → модель не просто генерирует промежуточные вопросы, но и отвечает на них. Это делает процесс прозрачным — ты видишь не только структуру, но и содержание рассуждений.
ШАГ 1 — Для каждого предложения сгенерируй вопросы
И кратко ответь на каждый (1-2 слова).
ШАГ 2 — Выбери релевантные пары "вопрос → ответ".
ШАГ 3 — Собери финальный вывод из отобранных пар.
3. Экстраполяция: комбо с ролевым фреймингом
Если задача требует разных углов зрения — назначь в Шаге 1 роли:
ШАГ 1 — Прочитай текст как [юрист / инвестор / конкурент].
Для каждого предложения задай вопрос с позиции этой роли.
PRCP находит скрытые связи, ролевой фрейминг задаёт направление поиска. Вместе — точнее, чем каждый метод отдельно.
Ресурсы
Название: MixRea: Benchmarking Explicit-Implicit Reasoning in Large Language Models
Код: https://anonymous.4open.science/r/MixRea
Авторы: Yuanqing Cai, Ziyi Huang, Minhao Liu, Lixin Duan, Wen Li, Yanru Zhang
Организация: Shenzhen Institute for Advanced Study, University of Electronic Science and Technology of China (UESTC)
Опыт-прецедент: Simons & Chabris (1999) — "Invisible Gorilla experiment", inattentional blindness
