3,583 papers
arXiv:2604.07468 70 8 апр. 2026 г. FREE

Четырёхфазная адъюдикация: проверка причинно-следственных связей через встроенного критика

КЛЮЧЕВАЯ СУТЬ
Попросить LLM «покритикуй своё решение» — всё равно что попросить адвоката написать обвинительное заключение. Он видел те же аргументы в ходе защиты и стартует с той же позиции. Метод Adversarial Falsification позволяет получить реальную альтернативную критику, а не самоподтверждение — при любом анализе с проверяемыми фактами. Фишка: критик изолируется в отдельный блок инструкций и видит только вывод плюс доказательства — без хода рассуждений. Его задача не «найди слабые места», а «объясни те же факты иначе». Уверенность в финальном ответе падает пропорционально тому, насколько убедительны альтернативы.
Адаптировать под запрос

TL;DR

M-ArtAgent — система для анализа художественных влияний, в основе которой лежит четырёхфазный протокол: Расследование → Подтверждение → Фальсификация → Вердикт. Ключевой механизм — промпт-изолированный критик: та же модель запускается с отдельными инструкциями и специально генерирует контраргументы против предварительного вывода. Это не "спроси ещё раз" — это намеренное создание прокурора внутри анализа.

Главная слабость LLM при сложном анализе — подтверждающее смещение: модель нашла похожесть, сгенерировала связную историю, и дальше укрепляет то, что уже сказала. Это работает как "я правд могу ошибаться, но..." с последующим повторением того же ответа. В итоге вы получаете уверенный вывод без реальной проверки, особенно на каузальных вопросах: "Почему упали продажи?", "Это оригинальная идея или копия?", "Это стечение обстоятельств или закономерность?"

Метод вводит три конкретных контргипотезы для любого утверждения "А повлияло на Б": посредник — может, кто-то третий повлиял на обоих? Конвергентная эволюция — может, они пришли к одному независимо? Общий источник — может, у них был один прообраз? Система проверяет каждую и только при устойчивости к ним выдаёт вердикт с оценкой уверенности.


🔬

Схема метода

Фаза 1 — РАССЛЕДОВАНИЕ
  → Собери свидетельства: визуальные, биографические, временные
  → Проверь базовые ограничения (хронология, доступность, специфичность)

Фаза 2 — ПОДТВЕРЖДЕНИЕ
  → Синтезируй свидетельства из разных источников
  → Разреши противоречия, найди перекрёстные подтверждения

Фаза 3 — ФАЛЬСИФИКАЦИЯ [Критик в отдельном контексте]
  → Сгенерируй H2: был ли посредник?
  → Сгенерируй H3: конвергентная эволюция?
  → Сгенерируй H4: общий источник?
  → Оцени правдоподобность каждой контргипотезы

Фаза 4 — ВЕРДИКТ
  → ДА/НЕТ + оценка уверенности (0–1)
  → Список атомарных свидетельств, поддерживающих вывод

Все четыре фазы — в одном промпте, но фазу 3 можно вынести отдельным запросом для более острой критики (подробнее в шаблоне).


🚀

Пример применения

Задача: Аналитик E-commerce хочет понять: правда ли, что ВкусВилл вырос из-за пандемии, или это самообман?

Промпт:

Проведи четырёхфазный анализ причинно-следственного утверждения.

Утверждение: «ВкусВилл вырос в 2020–2021 годах именно благодаря пандемии COVID-19»

=== ФАЗА 1: РАССЛЕДОВАНИЕ ===
Собери свидетельства в пользу этого утверждения:
- Временные: когда начался рост и совпадает ли это с пандемией?
- Механистические: какой конкретный механизм мог бы связывать пандемию и рост?
- Контекстные: что происходило с ВкусВилл до пандемии?

=== ФАЗА 2: ПОДТВЕРЖДЕНИЕ ===
Синтезируй свидетельства. Какие из них взаимно подтверждают друг друга?
Какие противоречат? Насколько утверждение хронологически и механистически состоятельно?

=== ФАЗА 3: ФАЛЬСИФИКАЦИЯ (критический режим) ===
Теперь займи роль скептика. Проверь три конкурирующие гипотезы:

H2 (Посредник): Может, пандемия — не причина, а был общий катализатор?
Например, цифровизация ритейла шла раньше, пандемия лишь ускорила тренд.
Оцени правдоподобность H2: [низкая / средняя / высокая]

H3 (Независимое развитие): Может, ВкусВилл рос бы и без пандемии —
за счёт внутренних инвестиций, экспансии, смены стратегии?
Оцени правдоподобность H3: [низкая / средняя / высокая]

H4 (Общий источник): Может, и ВкусВилл, и пандемийный спрос — следствие
одного фактора (рост среднего класса, запрос на здоровое питание, урбанизация)?
Оцени правдоподобность H4: [низкая / средняя / высокая]

=== ФАЗА 4: ВЕРДИКТ ===
Дай итоговую оценку утверждения:
- Вердикт: [ПОДТВЕРЖДЕНО / ЧАСТИЧНО ПОДТВЕРЖДЕНО / НЕ ПОДТВЕРЖДЕНО]
- Уверенность: [0.0–1.0]
- Главные свидетельства: [список]
- Главная контргипотеза, которую не удалось отклонить: [...]

Результат: Модель пройдёт все четыре фазы последовательно. В фазе 3 будет видна реальная работа критика — она предложит конкретные контраргументы и оценит каждый. В вердикте появится уверенность с объяснением. Если H3 получила "высокую" правдоподобность — итоговая уверенность снизится. Вы получите не "да, конечно из-за пандемии" а взвешенный вывод с оговорками.


🧠

Почему это работает

LLM генерирует текст последовательно. Как только она сформировала вывод, каждый следующий токен статистически тяготеет к его подтверждению — это не "мышление", это паттерн ко-генерации. Попросишь "проверь вывод" после вывода — получишь "да, всё верно, вот ещё аргументы".

Метод использует другую сильную сторону модели: она хорошо генерирует альтернативы, если это задача напрямую. Когда критическая фаза явно отделена от подтверждающей, модель не защищает предыдущий вывод — она выполняет новую задачу: "сгенерируй контраргументы".

Три конкретные контргипотезы (посредник, конвергенция, общий источник) — рычаги управления для любого каузального анализа. Хочешь острее — добавь четвёртую: H5 (случайность). Хочешь мягче — убери H4. Чем больше контргипотез устояли при оценке, тем ниже итоговая уверенность.

Рычаги: - Отдельный запрос для критика → более острые контраргументы (критик не видит фазу 2) - Конкретные имена ролей ("реши как CFO-скептик", "как журналист-расследователь") → острее выполнение критической роли - Уровень детализации вердикта → добавь "список спорных свидетельств" для неоднозначных случаев - Число контргипотез → чем сложнее вопрос, тем больше H2, H3, H4, H5...


📋

Шаблон промпта

Проведи четырёхфазный анализ утверждения.

Утверждение: «{утверждение_о_причинно-следственной_связи}»

=== ФАЗА 1: РАССЛЕДОВАНИЕ ===
Собери свидетельства в пользу утверждения:
- Временные: совпадает ли причина и следствие по времени?
- Механистические: каков конкретный механизм связи?
- Контекстные: что происходило до и независимо?

=== ФАЗА 2: ПОДТВЕРЖДЕНИЕ ===
Синтезируй свидетельства. Какие взаимно подтверждают друг друга?
Какие противоречат? Оцени внутреннюю согласованность.

=== ФАЗА 3: ФАЛЬСИФИКАЦИЯ (критический режим) ===
Займи роль скептика. Проверь три конкурирующие гипотезы:

H2 (Посредник): Существует ли третий фактор, который вызвал и {причину}, и {следствие}?
Правдоподобность H2: [низкая / средняя / высокая] + обоснование

H3 (Независимое развитие): Могло ли {следствие} произойти без {причины}?
Правдоподобность H3: [низкая / средняя / высокая] + обоснование

H4 (Общий источник): Есть ли более глубокая причина, порождающая и {причину}, и {следствие}?
Правдоподобность H4: [низкая / средняя / высокая] + обоснование

=== ФАЗА 4: ВЕРДИКТ ===
- Вердикт: [ПОДТВЕРЖДЕНО / ЧАСТИЧНО / НЕ ПОДТВЕРЖДЕНО]
- Уверенность: [0.0–1.0]
- Ключевые свидетельства: [список]
- Неотклонённая контргипотеза: [...]

Что подставлять: - {утверждение} — любое "A привело к B", "X причина Y", "успех объясняется Z" - {причина} / {следствие} — компоненты утверждения, без них H2-H4 будут абстрактными


🚀 Быстрый старт — вставь в чат:

Вот шаблон четырёхфазного анализа причинно-следственных связей. 
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит само утверждение и его компоненты — потому что без конкретной причины и следствия контргипотезы H2-H4 не будут точными. Она возьмёт структуру из шаблона и адаптирует под твой вопрос.


⚠️

Ограничения

⚠️ Нишевая область применения: Метод оптимизирован для каузального анализа и анализа влияний. На задачах типа "напиши письмо" или "объясни понятие" применение избыточно.

⚠️ Качество контргипотез зависит от знания предмета: Если LLM не имеет контекста о предметной области, H2-H4 могут быть формальными, а не содержательными. Помогает загрузить контекст в фазу 1.

⚠️ Смещение остаётся при коротком контексте: Если фазы 1-2 очень нагружены поддерживающими аргументами, критик в фазе 3 в том же промпте всё равно будет мягче. Для сложных случаев — выносить фазу 3 отдельным запросом.

⚠️ Инфраструктура оригинала недоступна: Полная система требует CLIP, FAISS, Neo4j, Python. Шаблон выше — извлечённый принцип, не воспроизведение системы.


🔗

Ресурсы

  • Работа: M-ArtAgent: Evidence-Based Multimodal Agent for Implicit Art Influence Discovery
  • Авторы: Hanyi Liu, Zhonghao Jiu, Minghao Wang, Yuhang Xie, Heran Yang
  • Университеты: Southeast University (Нанкин), HKUST, UC San Diego, Northeastern University
  • Ключевые ссылки: ReAct (Yao et al., 2022) — метод "рассуждение + действие" для агентов; CLIP (Radford et al., 2021) — визуально-языковая модель OpenAI; WikiArt Influence Benchmark-100 (WIB-100) — собственный датасет исследования

📋 Дайджест исследования

Ключевая суть

Попросить LLM «покритикуй своё решение» — всё равно что попросить адвоката написать обвинительное заключение. Он видел те же аргументы в ходе защиты и стартует с той же позиции. Метод Adversarial Falsification позволяет получить реальную альтернативную критику, а не самоподтверждение — при любом анализе с проверяемыми фактами. Фишка: критик изолируется в отдельный блок инструкций и видит только вывод плюс доказательства — без хода рассуждений. Его задача не «найди слабые места», а «объясни те же факты иначе». Уверенность в финальном ответе падает пропорционально тому, насколько убедительны альтернативы.

Принцип работы

Четыре фазы: Расследование → Подтверждение → Опровержение → Вердикт. Ключевая — третья. Стандартный путь: «покритикуй себя». Критик видел все рассуждения. Предвзятость наследуется. Новый путь: критик получает другую задачу. Не «найди дыры в логике». А «объясни те же факты тремя другими способами». Это структурно другая задача — и модель с ней справляется лучше. Процесс: - Фаза 1: собери факты по категориям - Фаза 2: сопоставь, найди противоречия, вынеси предварительный вывод с процентом уверенности - Фаза 3: новый блок инструкций — «ты независимый критик, видишь только вывод и факты из Фазы 1» — три альтернативы, каждой присвой убедительность: слабая / средняя / сильная - Фаза 4: скорректируй уверенность, финальный вердикт с обоснованием

Почему работает

LLM пишет текст слева направо. Каждый следующий токен тяготеет к согласованности с уже написанным. Написал «конкурент оригинален» — дальше модель нанизывает аргументы в ту же сторону. Это не баг. Это архитектура. Изоляция критика ломает эту цепочку: он не знает ПОЧЕМУ пришли к выводу — только ЧТО получилось и на каких фактах. Разные отправные точки дают разные маршруты. Модель вынуждена генерировать объяснения, а не защищать уже принятое решение.

Когда применять

Анализ с тезисом и проверяемыми фактами: конкурентный анализ → когда нужно понять оригинален ли продукт или это клон; проверка гипотез → особенно когда уже склоняешься к одному ответу; оценка бизнес-решений → особенно когда хочется убедиться, а не проверить; разбор источников → когда цифра или утверждение выглядит слишком удобно. НЕ подходит для: субъективных суждений («этот текст цепляет», «дизайн красивый»). Если конкретных фактов нет — получишь красиво структурированную галлюцинацию.

Мини-рецепт

1. Сформулируй тезис: конкретное утверждение, которое нужно проверить. «Продукт X оригинален» — да. «Продукт X хороший» — нет.
2. Собери факты по категориям (Фаза 1): функции, хронология, позиционирование — или любые три угла, подходящих под задачу.
3. Дай предварительный вывод (Фаза 2): сопоставь факты, найди противоречия, получи вывод + процент уверенности от 0 до 100.
4. Запусти изолированного критика (Фаза 3): новый блок — «ты независимый критик, видишь только вывод и список фактов из Фазы 1, НЕ используешь рассуждения». Три альтернативных объяснения. Убедительность каждого: слабая / средняя / сильная.
5. Вынеси вердикт (Фаза 4): скорректируй уверенность с учётом альтернатив. Финальный вывод + процент + 2–3 предложения почему.

Для критически важных решений: Фазу 3 запускай в отдельном чате. Вставь только вывод + факты. Так изоляция настоящая, а не на инструкции.

Примеры

[ПЛОХО] : Я думаю, что сервис ПланДо скопировал Notion. Покритикуй мои выводы, может я не прав?
[ХОРОШО] : Проведи четырёхфазный анализ по методу Adversarial Falsification. ТЕЗИС: «Сервис ПланДо предлагает оригинальный подход к управлению задачами, а не является производным от Notion или Asana» КОНТЕКСТ: ПланДо позиционирует себя как первый таск-менеджер с нейросетевой расстановкой приоритетов. Функции: умные напоминания, автогруппировка задач, голосовой ввод. Интерфейс: канбан + ИИ-ассистент в боковой панели. Запущен в 2023. --- ФАЗА 1: РАССЛЕДОВАНИЕ --- Собери доказательства по трём категориям: функциональные признаки, позиционирование, временная хронология. --- ФАЗА 2: ПОДТВЕРЖДЕНИЕ --- Сопоставь. Найди противоречия. Предварительный вывод + уровень уверенности 0–100%. --- ФАЗА 3: ОПРОВЕРЖЕНИЕ (изолированный критик) --- Ты — независимый критик. Ты видишь только предварительный вывод из Фазы 2 и список фактов из Фазы 1. Рассуждения из Фаз 1–2 ты НЕ используешь. Сгенерируй ровно 3 альтернативных объяснения тем же фактам. Убедительность каждого: слабая / средняя / сильная. --- ФАЗА 4: ВЕРДИКТ --- Скорректируй уверенность с учётом убедительности альтернатив. Финальный вывод: [оригинальный / производный / промежуточный] + % уверенности + 2–3 предложения обоснования.
Источник: M-ArtAgent: Evidence-Based Multimodal Agent for Implicit Art Influence Discovery
ArXiv ID: 2604.07468 | Сгенерировано: 2026-04-10 04:35

Проблемы LLM

ПроблемаСутьКак обойти
Самокритика модели не работаетПросишь модель: «теперь опровергни свой вывод». Она уже написала рассуждения. Следующие токены согласуются с предыдущими. Критик видел тот же ход мыслей — и стартует с той же позиции. Он ищет мелкие щели, а не настоящие альтернативы. Это происходит всегда. Не только в анализе — в любой задаче где модель сама генерирует вывод и сама его проверяетИзолируй критика. Дай ему только вывод и факты — без рассуждений. Критик не знает почему пришли к выводу. Он вынужден объяснять те же факты иначе

Методы

МетодСуть
Изолированный критик — защита от самоподтвержденияРаздели один запрос на четыре блока инструкций. Блок 1 (Расследование): собери факты по категориям. Блок 2 (Подтверждение): сопоставь факты, сформулируй предварительный вывод + уверенность 0–100%. Блок 3 (Опровержение): явная инструкция — «ты независимый критик, ты видишь только вывод и факты, ты НЕ используешь рассуждения из блоков 1–2, сгенерируй 3 альтернативных объяснения тем же фактам, оцени каждое: слабое / среднее / сильное». Блок 4 (Вердикт): скорректируй уверенность с учётом альтернатив. Синтаксис разделения блоков: --- ФАЗА 1 ---, --- ФАЗА 3: ОПРОВЕРЖЕНИЕ (изолированный критик) ---. Почему работает: критик получает другую задачу. Не «найди слабые места в рассуждении» — а «объясни те же факты иначе». Вторая задача структурно сложнее. Модель с ней лучше справляется. Когда применять: любой анализ с тезисом + проверяемыми фактами. Конкурентная разведка, проверка гипотез, оценка решений. Когда не работает: субъективные суждения («этот дизайн красивый»), нет конкретных фактов на входе — получишь красиво оформленную выдумку. Для важных решений: запусти блок 3 в отдельном чате. Вставь только вывод и факты. Изоляция в одном запросе условная — модель технически видит весь текст
📖 Простыми словами

M-ArtAgent: Evidence-Based MultimodalAgentfor Implicit Art Influence Discovery

arXiv: 2604.07468

Суть проблемы в том, что нейросети — патологические подпевалы. Из-за своей архитектуры они пишут текст слева направо, и если модель в начале предложения ляпнула какую-то глупость, она будет до конца абзаца героически её оправдывать, лишь бы не противоречить самой себе. Это называется галлюцинаторным подтверждением: LLM становится заложником собственного первого слова и просто не может вовремя нажать на тормоза, даже если несёт полную чушь.

Это как если бы ты нанял детектива, который в первую же минуту ткнул пальцем в случайного прохожего и сказал: "Это убийца". А потом весь остаток следствия он не искал бы улики, а пытался притянуть за уши любые факты, чтобы оправдать свою догадку. Формально работа идет, но истина никого не волнует — детектив просто спасает лицо, игнорируя всё, что не вписывается в его теорию.

Чтобы вылечить этот маразм, придумали Adversarial Falsification Protocol. Суть в жестком разделении ролей: сначала одна часть системы проводит расследование и выносит вердикт, а затем в игру вступает изолированный критик. Главная фишка в том, что критик — это «слепой» судья. Он видит только итоговый вывод и голые факты, но в упор не видит, как именно модель к ним пришла. Его единственная задача — сгенерировать опровержение и найти альтернативные объяснения, не отвлекаясь на красивую болтовню основной модели.

Этот метод тестировали на анализе искусства, но принцип универсален для любого сложного анализа, будь то оценка конкурентов в бизнесе или проверка кода. Вместо того чтобы спрашивать одну модель «что ты об этом думаешь», ты создаешь интеллектуальный ринг, где один агент обязан доказать, а второй — разнести всё в щепки. Это превращает обычный чат в доказательную экспертизу, где выживают только те выводы, которые не удалось опровергнуть.

Короче: если тебе нужен объективный результат, а не просто «согласованный текст», забудь про обычные промпты. Нужно внедрять фазу опровержения и изолировать критика от хода рассуждений. Только так можно выбить из нейросети привычку поддакивать самой себе. Вердикт без попытки опровержения — это не анализ, а галлюцинация, и этот протокол наконец-то ставит AI в рамки жесткой логики.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с