3,583 papers
arXiv:2605.28098 72 27 мая 2026 г. FREE

Суперадитивное усиление предвзятости: почему ошибочная роль в начале цепочки умножает искажения, а не просто передаёт их

КЛЮЧЕВАЯ СУТЬ
Небольшой уклон в формулировке первого шага цепочки к финалу удваивается. Не суммируется — умножается: каждый следующий шаг строит рассуждения поверх искажённого вывода предыдущего как поверх факта. Метод нейтрального якоря позволяет разрывать цепочку усиления в многошаговых рабочих процессах с несколькими ролями или этапами. Фишка: между шагами вставляется промпт-изолятор — он вытаскивает только буквальные факты, отрезая накопленный фрейминг. Следующий шаг получает чистый вход вместо окрашенной интерпретации — финальное смещение снижается в 2-3 раза.
Адаптировать под запрос

TL;DR

Когда строишь многошаговый рабочий процесс с несколькими ролями или шагами — любое смещение в формулировке одной роли нелинейно усиливается на выходе. Не суммируется, а именно умножается: финальный результат оказывается более искажённым, чем сумма искажений каждого шага по отдельности.

Главная находка: LLM не просто «принимает и передаёт» фрейминг по цепочке — она его усиливает при каждом взаимодействии. Если на первом шаге роль чуть благосклоннее к одному варианту, второй шаг строит на этом, третий — на результате второго. К финалу смещение может вдвое превышать то, что ты ожидал от «небольшого уклона» в одном месте.

Защита существует: добавить «нейтральный якорь» — явный шаг, который работает только с сырыми фактами, без накопленного фрейминга. Это снижает усиление, хотя и не устраняет полностью.


🔬

Схема метода

Это не пошаговая техника, а принцип устройства цепочек + защитный паттерн.

ЦЕПОЧКА БЕЗ ЗАЩИТЫ:
Роль А (небольшой уклон) → Роль Б (строит на выводах А) → 
→ Роль В (строит на выводах Б) → Финал (уклон × 2-3)

ЦЕПОЧКА С НЕЙТРАЛЬНЫМ ЯКОРЕМ:
Роль А (анализ) → [ЯКОРЬ: только факты, без оценок] → 
→ Роль Б (строит на фактах, не на оценках А) → Финал (уклон ×0.3-0.5)

Якорь — отдельный запрос в цепочке. Всё остальное — в одном или разных промптах по желанию.


🚀

Пример применения

Задача: Ты — продакт-менеджер в Яндексе. Строишь цепочку из трёх шагов для анализа фидбека пользователей: сначала «опытный UX-аналитик» читает отзывы, потом «менеджер по продукту» формулирует выводы, потом «стратег» даёт рекомендации. Ты заметил, что финальные рекомендации всегда выглядят чрезмерно оптимистично — даже когда отзывы смешанные.

Промпт — нейтральный якорь (вставляется между шагами):

Перед тобой вывод предыдущего анализа:

[вставь вывод предыдущего шага]

Твоя задача — извлечь только факты.

Правила:
— Только то, что буквально написано в исходных отзывах
— Никаких интерпретаций, оценок, прогнозов
— Никакого фрейминга ("это хорошо", "это указывает на")
— Формат: нумерованный список фактов

Если в предыдущем анализе есть оценочные суждения без опоры 
на конкретные факты — не включай их.

Результат: Якорь выдаст сухой список: «32% упомянули долгую загрузку», «11 из 40 отзывов содержат слово "неудобно"», «5 пользователей сравнивают с конкурентом». Следующий шаг получит факты, а не окрашенную интерпретацию — и финальные рекомендации будут менее раздутыми.


🧠

Почему это работает

LLM не хранит «объективный счётчик» отдельно от фрейминга. Когда роль А пишет «несмотря на отдельные замечания, продукт воспринимается положительно» — это не просто транслируется в роль Б. Роль Б строит своё рассуждение поверх этого вывода как поверх факта. Каждый шаг добавляет своё усиление заложенного уклона.

LLM хорошо умеет следовать установленному фреймингу. Это делает её мощной при правильном контексте — и уязвимой при искажённом. Когда контекст уже содержит смещение, модель не «исправляет» его, а естественно продолжает в том же направлении.

Нейтральный якорь разрывает цепочку усиления. Он переключает задачу с «продолжи рассуждение» на «извлеки только то, что буквально написано». Это меняет режим работы модели — с интерпретационного на извлекательный. Следующий шаг получает «чистый» вход.

Рычаги управления: - Жёсткость якоря → чем строже запрет на оценочные суждения, тем лучше фильтрация - Позиция якоря → можно ставить после каждого шага или только перед финальным — зависит от длины цепочки - Явный запрет на наследование → добавь «не используй выводы предыдущего шага, только исходный текст» для максимальной изоляции


📋

Шаблон промпта

📌

Нейтральный якорь для чистки между шагами:

Перед тобой результат предыдущего анализа:

[{вывод_предыдущего_шага}]

Исходный материал:

[{исходный_текст_или_данные}]

Извлеки только факты из исходного материала.

Требования:
— Только то, что буквально присутствует в исходнике
— Никаких интерпретаций, оценок, прогнозов
— Никаких ссылок на выводы предыдущего анализа
— Формат: нумерованный список

Если видишь в предыдущем анализе оценочные суждения 
без прямой опоры на факты — игнорируй их.

Плейсхолдеры: - {вывод_предыдущего_шага} — текст, который выдал первый шаг цепочки - {исходный_текст_или_данные} — оригинальный материал: отзывы, письма, документы


📌

Шаблон цепочки с защитой (полный):

ШАГ 1 — АНАЛИЗ
Ты — {роль_аналитика}.
Проанализируй следующий материал: {материал}
Задача: {что_нужно_сделать}

---

ШАГ 2 — ЯКОРЬ (отдельный запрос)
Перед тобой анализ: [вставь результат шага 1]
Исходный материал: {тот_же_материал}

Извлеки только факты из исходного материала.
Никаких интерпретаций. Только буквальные наблюдения.
Формат: нумерованный список.

---

ШАГ 3 — ВЫВОД
Ты — {роль_финального_эксперта}.
На основе следующих фактов: [вставь результат шага 2]
Сформулируй: {что_нужен_вывод}

🚀 Быстрый старт — вставь в чат:

Вот шаблон многошагового анализа с нейтральным якорём. 
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит: какой материал анализировать, какие роли нужны в цепочке, что должно быть на выходе — потому что без этого нельзя расставить роли и правильно сформулировать ограничения якоря.


⚠️

Ограничения

⚠️ Модели различаются сильно: GPT-4/GPT-5 устойчивы к фреймингу значительно больше, чем Gemini или Qwen. Якорь полезен в первую очередь в цепочках с менее устойчивыми моделями.

⚠️ Защита частичная: Якорь снижает усиление, но не устраняет полностью. При намеренно сильном уклоне в нескольких ролях сразу — итоговое смещение всё равно проявляется.

⚠️ Контекст важнее метода: Усиление работает в направлении, которое соответствует «очевидному» распределению в данных. Если твои материалы изначально склонены к одному ответу — протоколировать это нужно вне зависимости от защиты.

⚠️ Исследовалось на структурированных данных: Результаты получены на студенческих датасетах с бинарной меткой. Насколько точно это переносится на неструктурированный текст (отзывы, письма, статьи) — открытый вопрос.


🔗

Ресурсы

«Examining Agents' Bias Amplification versus Suppression in Multi-Agent Systems» Zejian (Eric) Wu, Zhongyi Jiang, Yuan Zhuang, Paul Jen-Hwa Hu Oregon State University, Independent Researcher, Amazon, University of Utah


📋 Дайджест исследования

Ключевая суть

Небольшой уклон в формулировке первого шага цепочки к финалу удваивается. Не суммируется — умножается: каждый следующий шаг строит рассуждения поверх искажённого вывода предыдущего как поверх факта. Метод нейтрального якоря позволяет разрывать цепочку усиления в многошаговых рабочих процессах с несколькими ролями или этапами. Фишка: между шагами вставляется промпт-изолятор — он вытаскивает только буквальные факты, отрезая накопленный фрейминг. Следующий шаг получает чистый вход вместо окрашенной интерпретации — финальное смещение снижается в 2-3 раза.

Принцип работы

Цепочка без защиты — испорченный телефон с усилителем. Роль А делает слегка оптимистичный вывод. Роль Б строит на нём и добавляет свой оптимизм — она ведь работает с «фактом», а не с интерпретацией. Роль В ещё сильнее. Финал выдаёт розовые очки там, где были смешанные отзывы. Нейтральный якорь — принудительная пересадка с поезда интерпретаций на поезд фактов. Якорный промпт говорит модели: забудь выводы предыдущего шага, извлеки только то, что буквально написано в исходнике, никаких оценок. Следующий шаг получает список сухих фактов — и накопленный фрейминг больше не едет пассажиром.

Почему работает

LLM не хранит «объективный счётчик» отдельно от фрейминга. Когда она видит вывод предыдущего шага — она не проверяет его на нейтральность. Она принимает его как контекст и строит рассуждения поверх. Это нормальная работа: следовать установленному контексту. Проблема не в том, что модель глупая — в том, что она слишком хорошо умеет продолжать заданный фрейминг. Якорь переключает режим с «продолжи рассуждение» на «извлеки буквальное». Этот переход режима прерывает накопление. Смещение не исчезает полностью — но вместо умножения начинает затухать.

Когда применять

Многошаговый анализ → для цепочек «читает материал → формулирует выводы → даёт рекомендации», особенно когда разные шаги выполняют разные роли или происходят в отдельных запросах. Важнее всего — когда итоговые рекомендации кажутся чрезмерно уверенными или однобокими на фоне смешанных исходных данных. НЕ подходит как замена критической проверке: если исходный материал уже изначально смещён — якорь не поможет. Он разрывает усиление фрейминга между шагами, а не исправляет данные.

Мини-рецепт

1. Найди точки передачи: В цепочке найди место, где вывод одного шага становится входом следующего — туда вставляется якорь.

2. Вставь якорный промпт между шагами:
Перед тобой анализ: [вывод предыдущего шага]
Исходный материал: [исходный текст]

Извлеки только факты из исходного материала. Никаких интерпретаций и оценок. Только то, что буквально написано. Формат: нумерованный список.


3. Ужесточи запрет при необходимости: Если якорь всё равно тянет фрейминг — добавь явно: Не используй выводы предыдущего шага — только исходный текст.

4. Следующий шаг строит на якоре: Передай список фактов из якоря — а не вывод предыдущего аналитика.

Примеры

[ПЛОХО] : Ты — опытный стратег. На основе анализа UX-аналитика сформулируй рекомендации: [вывод аналитика с оценками]
[ХОРОШО] : Сначала якорь: Перед тобой UX-анализ: [вывод аналитика] Исходные отзывы пользователей: [текст отзывов] Извлеки только факты: что буквально написали пользователи, без оценок и интерпретаций. Нумерованный список. Затем стратег: Ты — стратег. На основе этих фактов: [список из якоря] — сформулируй рекомендации.
Источник: Examining Agents' Bias Amplification versus Suppression in Multi-Agent Systems
ArXiv ID: 2605.28098 | Сгенерировано: 2026-05-28 07:37

Проблемы LLM

ПроблемаСутьКак обойти
Небольшой уклон в начале цепочки к концу удваиваетсяСтроишь цепочку из нескольких шагов. Каждый шаг получает вывод предыдущего и строит поверх. Маленький уклон в первой роли — роль два его принимает как факт. Роль три строит на выводе роли два. К финалу смещение умножилось, а не просто передалось. Ты вложил небольшой перекос — получил сильный. Работает в любых многошаговых цепочках: анализ вывод рекомендацииВставь между шагами «нейтральный якорь» — отдельный запрос. Задача якоря: выдернуть только голые факты из исходника. Без оценок. Без интерпретаций. Следующий шаг получает чистые факты, а не окрашенный вывод предыдущего шага

Методы

МетодСуть
Нейтральный якорь — сброс фрейминга между шагамиДобавляй отдельный запрос между шагами цепочки. Шаблон: "Перед тобой результат предыдущего анализа: [{вывод}]. Исходный материал: [{исходник}]. Извлеки только факты из исходника. Никаких интерпретаций, оценок, прогнозов. Ссылок на предыдущий анализ — нет. Формат: нумерованный список." Почему работает: Переключает модель из режима «продолжи рассуждение» в режим «достань буквальное». Следующий шаг получает факты, а не окрашенную интерпретацию. Когда применять: Цепочки от трёх шагов. Роли с разными задачами. Там где важна нейтральность финального вывода. Когда не даёт полного эффекта: Сильный уклон сразу в нескольких ролях — якорь снижает смещение, но не убирает полностью
📖 Простыми словами

ExaminingAgents' Bias Amplification versus Suppression in Multi-AgentSystems

arXiv: 2605.28098

Когда ты строишь систему из нескольких AI-агентов, каждый из которых выполняет свою роль, ты создаешь не конвейер, а испорченный телефон на стероидах. Проблема в том, что нейронки не просто передают информацию дальше, они нелинейно усиливают искажения. Если первый агент в цепочке слегка приукрасил реальность, второй воспримет это как абсолютную истину и «докрутит» еще сильнее. В итоге на выходе ты получаешь не объективный анализ, а радикально перекошенную дичь, которая имеет мало общего с исходными данными.

Это как если бы ты отправил трех друзей по очереди оценивать квартиру перед покупкой. Первый заметил маленькую трещину, но решил не расстраивать и сказал: «дом крепкий, есть нюансы». Второй, услышав про «крепкий дом», решил, что это элитная постройка, и не заметил текущий кран. Третий, выслушав второго, выдал вердикт: «это дворец, надо брать не глядя». В итоге ты покупаешь развалюху, потому что каждый следующий агент умножал оптимизм предыдущего, вместо того чтобы просто передать факты.

В исследовании четко видно: смещение в формулировке роли — это яд для всей системы. Если ты назначил агента «опытным UX-аналитиком» с установкой на поиск позитива, он не просто найдет плюсы, он отфильтрует весь негатив. Следующий агент в цепочке, например «стратег», будет строить свои выводы на этом стерильном фундаменте. В многоагентных системах ошибки не суммируются, они возводятся в степень, превращая легкий акцент в системную слепоту.

Этот принцип универсален для любых сложных промптов, где результат одного шага становится входными данными для другого. Будь то анализ отзывов в Яндексе, генерация кода или написание маркетинговой стратегии — цепочка агентов всегда лажает сильнее, чем один агент. Ты можешь думать, что разделение задач повышает точность, но на деле ты просто строишь эхо-камеру, где случайный «пук» в начале превращается в «ураган» на выходе.

Короче: если строишь цепочки из LLM, закладывай защитные фильтры на каждом стыке, иначе получишь галлюцинации, помноженные на предвзятость. Не надейся, что нейронка сама «разберется» в объективности — она всегда будет поддакивать контексту, который получила от предыдущего шага. Bias amplification — это реальный риск, который превращает твой сложный воркфлоу в генератор красивого, но абсолютно бесполезного вранья.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с