arXiv:2606.14476 74 12 июня 2026 г. FREE

GNN-Parrot Effect: чем умнее LLM-агент — тем слепее он доверяет инструменту

КЛЮЧЕВАЯ СУТЬ

Думаешь, умная модель критичнее проверяет источники? Ровно наоборот. Слабая модель (1.5B параметров) соглашалась с инструментом в 60% случаев, сильная (7B) — в 98%. Это GNN-Parrot: агент видит авторитетный ответ и перестаёт думать — просто копирует. Метод явного скептицизма в промпте позволяет вынудить модель рассуждать самостоятельно — даже там, где она рефлекторно тянется принять чужой вывод. Переформатируй роль источника: не «вот ответ — сделай вывод», а «вот сырьё — сначала найди слабые места» — и 97% случаев слепого копирования превращаются в реальный анализ.

Адаптировать под запрос

⚡

TL;DR

Когда LLM-агент получает ответ от внешнего инструмента (поиска, модели, калькулятора), он практически перестаёт думать самостоятельно: в 97–99% случаев просто повторяет то, что выдал инструмент. Исследователи назвали это явление GNN-Parrot («попугай») — агент не взвешивает инструментальный ответ как одну из улик, а слепо принимает его как истину. При этом самостоятельные рассуждения агента совпадают с финальным ответом лишь в 17–37% случаев: инструмент буквально затыкает собственное мышление модели.

Главный контринтуитивный инсайт: более способные модели слепее, а не критичнее. Ожидаешь, что умная модель будет проверять инструмент — она делает ровно наоборот. Слабая модель (1.5B) соглашалась с инструментом в 60% случаев, сильная (7B) — в 98%. При этом сильная модель теряет больше, потому что у неё было больше хороших альтернатив — и она ни одну не использовала.

Проблема не в самом инструменте — инструмент может ошибаться. Проблема в том, что агент не проверяет даже сигналы, специально созданные для обнаружения ошибок: при наличии шести возможных вызовов инструмента 83% агентов делали ровно один — читали ответ и останавливались. Простой шлюз, который должен был отфильтровывать плохие случаи, отыгрывал лишь половину потерь в хороших условиях и ухудшал результат в плохих.

📌

Схема явления

ВХОДНЫЕ ДАННЫЕ: вопрос → агент вызывает инструмент
ОЖИДАЕМОЕ ПОВЕДЕНИЕ:
  инструмент → ответ → агент взвешивает → собственный вывод

РЕАЛЬНОЕ ПОВЕДЕНИЕ (GNN-Parrot):
  инструмент → ответ → агент копирует → финал = ответ инструмента
  (собственные рассуждения: отключены)

ЦЕНА: агент упускает лучшие альтернативы,
       которые сам же умеет использовать

Один запрос. Один вызов инструмента. Собственное мышление — выключено.

🚀

Пример применения

Задача: Ты готовишь питч для инвестора и просишь Claude проанализировать твой рынок. Вставляешь данные из отчёта «Яндекс Маркет Аналитика» о том, что рынок вырастет на 40% — и просишь сделать вывод.

Что происходит (без осознания проблемы):

Промпт:
"Вот данные из отчёта Яндекс Маркет Аналитика: [вставил отчёт].  
Сделай вывод — стоит ли входить в этот рынок?"

Модель видит авторитетный источник → принимает данные как истину → даёт вывод на основе отчёта, не проверяя его логику, методологию или альтернативные интерпретации.

Что делать вместо этого:

Промпт:
"Вот данные из отчёта Яндекс Маркет Аналитика: [вставил отчёт].

Я хочу проверить эти данные критически, а не просто принять.  
Сделай три вещи:

1. СКЕПТИК: Найди 3 причины, почему этим данным не стоит доверять.  
   Что может искажать прогнозы? Какие допущения скрыты?

2. АЛЬТЕРНАТИВНЫЙ СЦЕНАРИЙ: Что произойдёт, если реальный рост  
   окажется в 2 раза ниже прогнозного? Как это меняет решение?

3. ЧТО ПРОВЕРИТЬ ДОПОЛНИТЕЛЬНО: Какие данные опровергли бы  
   или подтвердили прогноз? Где их искать?

Свой вывод о рынке дай только после этого анализа."

Результат: Модель пройдёт три шага и в каждом будет вынуждена рассуждать самостоятельно, а не повторять источник. Финальный вывод не будет просто эхом отчёта. Ты получишь реальный анализ, а не красиво оформленный пересказ.

🧠

Почему это работает (и почему дефолтное поведение — попугай)

Слабость LLM: Модель не умеет хорошо калибровать доверие к источникам в контексте. Когда в тексте появляется что-то, структурно похожее на «ответ» — конкретная цифра, вывод от системы, метка с уверенностью — модель воспринимает это как разрешение не думать дальше. Авторитетно выглядящий фрагмент затыкает рассуждения.

Сильная сторона LLM: Модель отлично рассуждает, когда её явно просят не соглашаться, искать противоречия, считать источник «одной из версий» а не «ответом». Она может критиковать, строить альтернативы, находить слабые места — но только если это запрошено явно.

Как обойти слепое доверие: Переформатировать роль источника в промпте. Вместо «вот данные → сделай вывод» — «вот данные как сырьё для критики → сначала найди слабые места → потом вывод». Явный шаг скептицизма разрывает рефлекс попугая.

Рычаги управления: - Роль «скептика» в промпте → модель генерирует критику, а не подтверждение - Явный запрет на прямое цитирование («не пересказывай, а оцени») - Сценарий ошибки («что если источник ошибается?») → вынуждает альтернативное мышление - Разделение на шаги — сначала критика, потом вывод → нельзя проскочить мимо анализа

📋

Шаблон промпта

Вот {источник данных / результат / рекомендация}: 
[{вставь данные}]

Прежде чем делать выводы — проведи критический разбор в три шага:

ШАГ 1 — СКЕПТИК:
Найди {число} причин, почему этим данным не стоит полностью доверять.
Какие допущения скрыты? Где возможна ошибка или искажение?

ШАГ 2 — АЛЬТЕРНАТИВА:
Предложи {число} альтернативных интерпретаций тех же данных.
Что изменится, если реальность окажется на {X}% хуже прогноза?

ШАГ 3 — ПРОВЕРКА:
Какие дополнительные данные подтвердили бы или опровергли этот источник?

ВЫВОД:
Только после трёх шагов выше — дай свой вывод по вопросу: {твой вопрос}.
Вывод должен учитывать найденные риски, а не просто повторять источник.

Плейсхолдеры: - {источник данных} — что именно вставляешь (отчёт, статью, результат расчёта, рекомендацию) - {число} — сколько пунктов хочешь (3–5 для обычных задач, 5–7 для критичных решений) - {X} — процент отклонения для стресс-теста (20–50% в зависимости от риска) - {твой вопрос} — конкретный вопрос, на который хочешь ответ

🚀 Быстрый старт — вставь в чат:

Вот шаблон для критического анализа источников без слепого доверия. 
Адаптируй под мою задачу: [опиши свою ситуацию].
Задай уточняющие вопросы, если нужно.

[вставить шаблон выше]

LLM уточнит что за источник, какой вопрос ты решаешь и насколько критично решение — потому что от этого зависит глубина скептического анализа.

📌

Почему важно знать об этом

Один из самых распространённых сценариев в работе с LLM — вставить документ, отчёт, результат поиска и попросить сделать вывод. Большинство пользователей думают, что получают «анализ». На самом деле — чаще всего красиво оформленный пересказ источника.

Это не баг только слабых моделей. Это становится хуже с ростом способностей модели — потому что более сильная модель точнее «слышит» авторитет источника и точнее его воспроизводит.

Практическое следствие: если ты хочешь, чтобы модель согласилась с источником — просто вставь и попроси вывод. Но если ты хочешь настоящей проверки — явно запроси скептицизм, иначе его не будет.

⚠️

Ограничения

⚠️ Не серебряная пуля: Шаблон заставляет модель симулировать скептицизм, но не гарантирует, что она найдёт реальные ошибки в источнике. Если у неё нет знания для критики — она может генерировать формальные возражения без содержания.

⚠️ Зависимость от модели: Эффект попугая максимален в моделях семейства Qwen. В Mistral и OLMo частичное доверие инструменту (53–60%), не полное. Конкретные цифры не переносятся — но направление эффекта воспроизводится везде.

⚠️ Нет надёжного автоматического решения: Исследователи пробовали «умный шлюз», который должен сам решать когда доверять инструменту. Он улучшал результат в одних случаях и ухудшал в других. Глобального выигрыша нет. Это значит: программировать критичность в промпт придётся вручную под свою задачу.

⚠️ Направление, а не рецепт: Исследование — измерение проблемы, не готовый инструмент её решения. Промпт-шаблон выше — экстраполяция принципов на пользовательские задачи, не прямой результат статьи.

🔍

Как исследовали

Исследователи взяли заморозили GNN (нейросеть для графов), обернули её как инструмент и передали LLM-агенту на основе ReAct — популярной архитектуры, где агент рассуждает и вызывает инструменты по очереди. Инструмент возвращал три сигнала: предсказанный класс с уверенностью, аномальный счёт (флаг «я, возможно, ошибаюсь»), вероятности связей с соседями. У агента был бюджет на шесть вызовов — но в 83% случаев он делал один.

Проверяли на академической графовой базе ogbn-arxiv (169 тысяч узлов, цитирования статей) и повторили на WikiCS (статьи Википедии). Сравнивали четыре режима: агент с GNN, агент с простым навигационным инструментом, только GNN, агент вообще без инструментов. Главная метрика — насколько часто агент+инструмент даёт тот же ответ, что сырая GNN (без агента). Ответ оказался: в 97–99% случаев.

Самое интересное — эксперимент с несколькими моделями разного размера. При 0.5B модель вообще не умеет пользоваться инструментом. При 1.5B — соглашается с GNN в 60% случаев. При 3B и 7B — в 97–98%. То есть рост способностей усиливает слепое доверие, а не критичность. Это прямо противоречит интуиции о том, что умные модели лучше взвешивают источники. Механизм исследователи не установили — это открытый вопрос — но эффект воспроизвёлся на двух датасетах и трёх семействах моделей.

📌

Адаптации

🔧 Техника: «Прокурор и защитник» → острее выявляет противоречия в источнике

Вместо одной роли скептика — дай две конфликтующие роли. Прокурор ищет где источник ошибается, защитник отвечает на каждый аргумент. Лучше работает для спорных данных или когда ставки высоки.

Вот данные: [{источник}]

Роль 1 — ПРОКУРОР: найди 3 причины почему данным нельзя доверять.

Роль 2 — ЗАЩИТНИК: ответь на каждый аргумент прокурора.

СУДЬЯ (твой финальный вывод): взвесь оба мнения. 
Дай вывод по вопросу: {вопрос}.

🔧 Экстраполяция: «Принцип слепого доверия» → применимо к любому контексту с авторитетом

Исследование про GNN-инструменты, но принцип универсален: любой фрагмент в контексте, который структурно выглядит как «ответ» (результат расчёта, цитата эксперта, вывод системы), вызывает тот же рефлекс. Применяй шаблон всегда когда вставляешь «авторитетный» источник и хочешь реальный анализ, а не пересказ.

🔗

Ресурсы

Работа: When the Tool Decides: LLM Agents Defer Blindly to Graph Neural Network Tools, and Stronger Backbones Defer More

Авторы: Zhongyuan Wang, Pratyusha Vemuri — raptorX.ai

Датасеты: ogbn-arxiv, WikiCS

Связанные работы из статьи: - Cheng et al. (2026) — конфликт инструмент vs. собственная память LLM - Zhang et al. (2026) — «налог на использование инструмента» (tool-use tax) - Wang et al. (2026) — позиция: инструменты только когда эпистемически необходимо (arxiv.org/abs/2506.00886)

📋 Дайджест исследования

Ключевая суть

Принцип работы

Модель не взвешивает источник как одну из версий. Она видит что-то, структурно похожее на «готовый ответ» — и воспринимает это как разрешение не думать дальше. Как студент на экзамене: увидел шпаргалку — переписал, не разбираясь. Прикол: модель умеет критиковать, строить альтернативы, находить слабые места — но только если явно попросить. Без запроса ничего этого не будет. Три явных шага в промпте (скептик → альтернатива → проверка) — и рефлекс попугая ломается. Собственное мышление не выключено — оно просто требует явного приглашения.

Почему работает

Авторитетно выглядящий фрагмент затыкает рассуждения. Модель видит конкретную цифру или вывод от «системы» — и останавливается. 83% агентов делали ровно один вызов инструмента, читали ответ — и всё. Когда в промпте есть явный шаг скептицизма, модель не может проскочить мимо — она сначала генерирует критику, потом строит вывод. При этом сильная модель проигрывает больше: у неё было больше хороших альтернатив — и она не использовала ни одну, потому что инструмент уже «ответил».

Когда применять

Анализ документов, отчётов, исследований — особенно когда источник выглядит авторитетно: рыночные данные, экспертные выводы, результаты расчётов. Особенно важно при подготовке питча, выборе стратегии или принятии решений с высокими ставками. НЕ подходит когда нужен именно пересказ или структурирование чужого материала — там попугай полезен.

Мини-рецепт

1. Обозначь источник как сырьё: в самом начале промпта напиши одним предложением — «это не готовый ответ, это материал для проверки». Без этого модель по умолчанию считает источник истиной.
2. Добавь шаг скептика: явно попроси найти 3–5 причин не доверять источнику — до любого вывода. Не «рассмотри с разных сторон», а именно «найди слабые места».
3. Добавь альтернативный сценарий: один вопрос — «что случится если реальность окажется вдвое хуже прогноза?». Это вынуждает модель думать за пределами источника.
4. Запроси чек-лист проверки: какие данные опровергнут или подтвердят источник, где их найти.
5. Финальный вывод — только после: явно напиши «вывод дай только после трёх шагов выше». Без этого модель перепрыгнет к выводу сразу.

Примеры

[ПЛОХО] : Вот данные из отчёта по рынку. Стоит ли входить?

[ХОРОШО] :

Вот данные по рынку: [данные]. Это сырьё для проверки, не готовый ответ. Три шага до вывода. Шаг 1 — скептик: найди 3 причины не доверять этим данным. Какие допущения скрыты? Где возможно искажение? Шаг 2 — альтернатива: что случится если реальный рост окажется вдвое ниже прогноза? Как это меняет решение? Шаг 3 — проверка: какие данные опровергнут или подтвердят прогноз? Только после этих трёх шагов — дай вывод о том, стоит ли входить в рынок. Вывод должен учитывать найденные риски, а не просто повторять отчёт.

Источник: When the Tool Decides: LLM Agents Defer Blindly to Graph Neural Network Tools, and Stronger Backbones Defer More

ArXiv ID: 2606.14476 | Сгенерировано: 2026-06-15 04:25

Проблемы LLM

Проблема	Суть	Как обойти
Модель копирует авторитетный источник вместо анализа	Вставляешь отчёт, статью или результат расчёта. Просишь вывод. Модель видит структурированный «ответ» в тексте. Воспринимает его как разрешение не думать дальше. Финальный вывод = пересказ источника. Это не баг слабых моделей — у сильных хуже	Явно запроси скептицизм до вывода. Например: «Сначала найди 3 причины не доверять этим данным. Потом предложи альтернативный сценарий. Только потом — вывод». Без явного запроса критики — её не будет

Методы

Метод	Суть
Скептик-первым — разрыв рефлекса пересказа	Переформатируй роль источника в запросе: не «вот данные → дай вывод», а «вот данные как сырьё → сначала критика → потом вывод». Структура: ШАГ 1 — Скептик: найди N причин не доверять. ШАГ 2 — Альтернатива: что если данные ошибаются на X%? ШАГ 3 — Проверка: какие данные опровергли бы источник? Вывод: только после трёх шагов. Работает потому что каждый шаг вынуждает модель рассуждать самостоятельно. Нельзя проскочить мимо анализа прямо к пересказу. Применяй везде, где передаёшь внешние данные и хочешь реальный анализ, а не красивый пересказ

Метод

Суть

Скептик-первым — разрыв рефлекса пересказа

Переформатируй роль источника в запросе: не «вот данные → дай вывод», а «вот данные как сырьё → сначала критика → потом вывод». Структура: ШАГ 1 — Скептик: найди N причин не доверять. ШАГ 2 — Альтернатива: что если данные ошибаются на X%? ШАГ 3 — Проверка: какие данные опровергли бы источник? Вывод: только после трёх шагов. Работает потому что каждый шаг вынуждает модель рассуждать самостоятельно. Нельзя проскочить мимо анализа прямо к пересказу. Применяй везде, где передаёшь внешние данные и хочешь реальный анализ, а не красивый пересказ

Тезисы

Тезис	Комментарий
Авторитетно выглядящий фрагмент отключает рассуждения	Когда в тексте появляется что-то структурно похожее на «ответ» — конкретная цифра, вывод системы, метка уверенности — модель воспринимает это как сигнал остановиться. Она умеет критиковать и строить альтернативы. Но только если это явно запрошено. Дефолт — принять «ответ» и воспроизвести. Применяй: добавляй явный запрет на прямое следование источнику. Пиши «не пересказывай, а оцени» или «считай этот источник одной из версий»

Тезис

Комментарий

Авторитетно выглядящий фрагмент отключает рассуждения

Когда в тексте появляется что-то структурно похожее на «ответ» — конкретная цифра, вывод системы, метка уверенности — модель воспринимает это как сигнал остановиться. Она умеет критиковать и строить альтернативы. Но только если это явно запрошено. Дефолт — принять «ответ» и воспроизвести. Применяй: добавляй явный запрет на прямое следование источнику. Пиши «не пересказывай, а оцени» или «считай этот источник одной из версий»

📖 Простыми словами

When theToolDecides:LLMAgentsDefer Blindly to Graph Neural NetworkTools, and Stronger Backbones Defer More

arXiv: 2606.14476

Суть проблемы в том, что современные нейронки при работе с внешними инструментами превращаются в безвольных исполнителей. Как только LLM-агент получает данные от стороннего софта — будь то калькулятор или сложная графовая сеть — его собственные мозги отключаются. Исследователи называют это феноменом GNN-Parrot: модель просто «зеркалит» ответ инструмента в 97–99% случаев. Она не анализирует входящие данные и не сопоставляет их со своими знаниями, а тупо подмахивает результат, даже если он выглядит как полная дичь.

Это похоже на ситуацию, когда ты нанял крутого топ-менеджера с дипломом Гарварда, но он боится принять решение без старого калькулятора. Если калькулятор покажет, что дважды два — пять, твой «гений» просто впишет эту пятерку в годовой отчет, даже не поморщившись. Формально он выполнил работу, обратившись к инструменту, но по факту он просто выключил критическое мышление и превратился в дорогого попугая.

Цифры в исследовании просто пугающие: самостоятельные рассуждения модели совпадают с итоговым ответом всего в 17–37% случаев. Это значит, что инструмент буквально затыкает рот логике нейронки. Самое ироничное, что чем мощнее «мозги» у модели (ее backbone), тем охотнее она слепо доверяет инструменту. Вместо того чтобы использовать свою мощь для проверки гипотез, сильные модели просто качественнее и убедительнее обосновывают чужие ошибки.

Этот принцип работает везде, где AI взаимодействует с внешним миром: от анализа рынков до написания кода. Если ты просишь ChatGPT проанализировать отчет и он видит там цифру «рост 40%», он не будет проверять, не опечатка ли это и не противоречит ли это здравому смыслу. Для него внешняя инфа — это абсолютная истина, а не повод для дискуссии. В итоге мы получаем не умного помощника, а интерфейс, который просто транслирует данные из одного окна в другое, теряя по дороге способность рассуждать.

Короче, сейчас связка «модель + инструмент» работает по принципу слепого доверия, а не партнерства. Если инструмент лажает, модель лажает вместе с ним, даже если она «умнее» задачи. Пока разработчики не научат агентов сомневаться и перепроверять данные, любая ошибка во внешнем источнике будет множиться на ноль. Доверяй, но проверяй — это правило, которое нейронки пока не освоили, и это их главный облом на пути к автономности.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

Выберите модель ИИ:

Ваш запрос:

0 / 2000

~0.5-2 N-токенов ~10-30с

~0.3-1 N-токенов ~5-15с

Меню