3,583 papers
arXiv:2607.01661 78 2 июля 2026 г. FREE

InfoDelphi: информационная асимметрия как ключ к реальным прогнозам в мультиагентном диалоге

КЛЮЧЕВАЯ СУТЬ
Три агента с одинаковыми данными — это не три мнения. Это одно мнение, повторённое трижды. Исследование проверило напрямую: ошибки агентов коррелируют на 60%+ — они не спорят, они вместе ошибаются в одну сторону. InfoDelphi позволяет получить реальный многосторонний анализ из нескольких источников — где агенты физически не способны согласиться без оснований. Фишка: каждый агент получает уникальный срез данных плюс общую базу для общего языка. Обмен идёт не финальными числами, а рассуждениями — это единственный способ передать знание из приватного среза другому агенту. Два раунда — финальное взвешивание по уверенности.
Адаптировать под запрос

TL;DR

Когда ты просишь LLM проанализировать вопрос сразу с нескольких точек зрения, давая всем "экспертам" одинаковые данные — они приходят к одному выводу. Не потому что он правильный, а потому что у них буквально одинаковые исходные данные. Это называется стадный эффект: видимость дискуссии без реальной проверки.

Главная находка: многоагентная дискуссия с одинаковой информацией у всех агентов ни лучше, ни хуже одного агента. Ошибки коррелируют на 60%+ — агенты буквально делают одинаковые промахи. Чем больше агентов с одними данными, тем сильнее они друг друга убеждают в одном (неправильном) ответе. Никакое усложнение промптов не помогает: добавь больше шагов рассуждения на плохих данных — получишь более уверенно ошибочный ответ.

InfoDelphi решает это через спроектированную информационную асимметрию: каждый агент получает уникальный срез данных плюс общую базу для общего языка. Затем агенты обмениваются не просто выводами, а рассуждениями — это единственный способ передать приватную информацию другому агенту. Итог: два раунда дискуссии, финальное взвешивание по уверенности.


🔬

Схема метода

(Всё работает в одном промпте)

ПОДГОТОВКА: Раздели источники
  └── Общий пул (~50%) → все три агента видят эти
  └── Приватный срез А → только Агент 1
  └── Приватный срез Б → только Агент 2  
  └── Приватный срез В → только Агент 3

РАУНД 1: Независимые прогнозы
  └── Каждый агент → вероятность + рассуждение на основе СВОИХ источников

РАУНД 2: Дискуссия с чужими рассуждениями
  └── Каждый агент читает рассуждения двух других → пересматривает вывод

АГРЕГАЦИЯ: Взвешенный итог
  └── Агенты с более крайними оценками получают больший вес
  └── Финальный вывод → единый ответ

🚀

Пример применения

Задача: Ты — копирайтер-фрилансер. Думаешь поднять ценник с 3 000 до 5 000 рублей за текст. Собрал 9 артефактов: отзывы клиентов, переписки про бюджеты, посты конкурентов с прайсами, обсуждения в телеграм-чате «Биржа копирайтеров», статистику по рынку. Нужен честный прогноз — уйдут ли клиенты или останутся?

Промпт:

Вопрос: Стоит ли поднять ставку с 3 000 до 5 000 рублей за текст?

Ты играешь роль трёх аналитиков. У каждого — разные данные.

ОБЩИЙ КОНТЕКСТ (видят все трое):
[Вставь 3 самых релевантных источника — например, общую статистику рынка копирайтинга]

АНАЛИТИК 1 — Клиентские сигналы:
[Вставь: отзывы клиентов, переписки про бюджеты, благодарности / жалобы на цену]

АНАЛИТИК 2 — Рыночное позиционирование:
[Вставь: прайсы конкурентов, посты с ценами в профессиональных чатах]

АНАЛИТИК 3 — Отраслевой контекст:
[Вставь: обсуждения в чатах «Биржа копирайтеров», статьи о ценообразовании]

---

РАУНД 1. Каждый аналитик — независимо:
- Прогноз: клиентская база сохранится? (Да / Нет)
- Вероятность: 0–100%
- Рассуждение: только на основе своих источников
- Уверенность: Высокая / Средняя / Низкая

РАУНД 2. Каждый аналитик читает выводы двух других:
- Пересматривает свой прогноз
- Объясняет: что изменилось и почему — или почему остаётся при своём

ИТОГ. На основе трёх финальных прогнозов:
Дай взвешенный вывод. Агентам с высокой уверенностью и крайними оценками — больший вес.
Финал: стоит поднимать? → вероятность сохранения клиентской базы: __%

Результат:

Модель покажет три независимых раунда: каждый агент формулирует вывод только из своих данных — клиентские сигналы, рыночные ориентиры, отраслевой контекст. В раунде 2 агенты увидят чужие рассуждения и либо скорректируют оценку, либо усилят её с объяснением. В итоге — взвешенный вывод с логикой, а не просто «стоит / не стоит».


🧠

Почему это работает

Слабость LLM: Когда все агенты получают одинаковые данные, модель генерирует похожие паттерны рассуждений — ведь входной контекст одинаковый. Итог: три агента приходят к одному выводу. Это не потому что они «согласились», а потому что у них буквально одинаковые стартовые условия. Ошибки коррелируют — агенты ошибаются вместе, в одну сторону.

Сильная сторона LLM: Модель хорошо следует ролям с чёткими инструкциями, хорошо извлекает выводы из конкретного текста, хорошо переформулирует чужую логику. Если дать агентам разные данные, они физически не могут прийти к одинаковому выводу — у них разные основания.

Как метод использует это: Приватные срезы данных создают реальное разнообразие позиций. Общий пул даёт общий язык для общения. Обмен рассуждениями (а не просто цифрами) позволяет передать знание из приватного среза другому агенту: агент 1 не видел клиентские отзывы, но прочитал рассуждение агента 2 — это лучше, чем ничего.

Рычаги управления: - Размер общего пула (50% по умолчанию) → уменьши до 30% для максимальной независимости агентов; увеличь до 70%, если хочешь больше согласованности - Число раундов (2 по умолчанию) → не делай 3+: агенты начинают сходиться к консенсусу и теряют разнообразие - Веса по уверенности → убери взвешивание, если хочешь демократичный усреднённый вывод - Размер приватных срезов → чем конкретнее и разнороднее источники в разных срезах, тем сильнее эффект


📋

Шаблон промпта

Вопрос: {вопрос}

Ты играешь роль трёх аналитиков. У каждого — разные данные.

ОБЩИЙ КОНТЕКСТ (видят все трое):
{общие_источники — самые релевантные для общего понимания}

АНАЛИТИК 1 — {роль_1, например: «Пользовательский опыт»}:
{источники_1 — тексты, скриншоты, данные}

АНАЛИТИК 2 — {роль_2, например: «Рыночный контекст»}:
{источники_2}

АНАЛИТИК 3 — {роль_3, например: «Отраслевые тренды»}:
{источники_3}

---

РАУНД 1. Каждый аналитик — независимо:
- Прогноз: {формат_ответа, например: «Да/Нет»}
- Вероятность: 0–100%
- Рассуждение: только из своих источников
- Уверенность: Высокая / Средняя / Низкая

РАУНД 2. Каждый аналитик читает выводы двух других:
- Пересматривает прогноз
- Объясняет: что изменилось — или почему остаётся при своём

ИТОГ. Взвешенный вывод:
Агентам с высокой уверенностью и крайними оценками — больший вес.
Финальный ответ: {вопрос} → {формат_итога}%

Плейсхолдеры: - {вопрос} — конкретный бинарный или открытый вопрос с чётким критерием - {общие_источники} — 2-3 самых релевантных куска текста, которые дают "общий язык" - {источники_1/2/3} — разные источники: статьи, переписки, отзывы, данные - {роль_1/2/3} — дай осмысленные роли, которые отражают характер данных - {формат_итога} — "вероятность успеха", "рекомендация", "итоговая оценка"


🚀 Быстрый старт — вставь в чат:

Вот шаблон InfoDelphi — мультиагентный анализ с разными данными у каждого агента. 
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить все поля.

[вставить шаблон выше]

LLM спросит: какой вопрос ты хочешь проанализировать, какие источники или данные у тебя есть, как их лучше разбить по ролям — потому что без конкретных срезов данных асимметрия не работает. Она возьмёт паттерн шаблона и соберёт промпт под твои материалы.


⚠️

Ограничения

⚠️ Нужны реальные отдельные источники: Метод не работает, если у тебя один текст или один большой документ. Нечего делить — нет асимметрии. Работает лучше всего, когда у тебя 6-10+ разнородных материалов: статьи, отзывы, данные из разных источников.

⚠️ Более двух раундов — хуже: Третий раунд снижает качество — агенты начинают сходиться к групповому консенсусу вместо независимых оценок. Используй ровно 2 раунда.

⚠️ Слишком мало общего контекста ломает коммуникацию: Если агенты не имеют общих оснований, они не могут интерпретировать рассуждения друг друга. Около 50% данных должны быть общими.

⚠️ Для субъективных и творческих задач — слабее: Метод создавался для задач с правильным ответом (прогнозы, факты, решения с критериями). Для оценки "красивого текста" или "интересной идеи" разнообразие данных не так критично.

⚠️ Полная автоматизация требует кода: Исследование реализовывало маршрутизацию доказательств через BM25-ранжирование программно. В чате ты делаешь это вручную — распределяешь источники сам. Это нормально для 1-2 задач, но трудоёмко в потоке.


🔗

Ресурсы

Статья: Diverse Evidence, Better Forecasts: Multi-Agent Deliberation Under Information Asymmetry

Авторы: Yuante Li, Yicheng Tao, Kate Zhang, Taozhi Wang, Gefei Gu, Yaxin Zhou — Carnegie Mellon University (School of Computer Science + College of Engineering)

Связанные концепции: Delphi method (Dalkey, 1969) — человеческий прообраз метода; Mixture-of-Agents (Wang et al., 2024); Superforecaster prompting (Karger et al., 2024)

Бенчмарк: POLYGYM — 375 бинарных вопросов из Polymarket, polymarket.com


📋 Дайджест исследования

Ключевая суть

Три агента с одинаковыми данными — это не три мнения. Это одно мнение, повторённое трижды. Исследование проверило напрямую: ошибки агентов коррелируют на 60%+ — они не спорят, они вместе ошибаются в одну сторону. InfoDelphi позволяет получить реальный многосторонний анализ из нескольких источников — где агенты физически не способны согласиться без оснований. Фишка: каждый агент получает уникальный срез данных плюс общую базу для общего языка. Обмен идёт не финальными числами, а рассуждениями — это единственный способ передать знание из приватного среза другому агенту. Два раунда — финальное взвешивание по уверенности.

Принцип работы

Стандартный мультиагентный подход: дай разным агентам разные роли, но одни и те же данные. InfoDelphi переворачивает это: роли вторичны, главное — разные данные. Все источники делятся 50/50: общий пул видят все три агента, приватные срезы — только один. Дальше конвейер: Раунд 1 — каждый выдаёт прогноз только из своих данных. Раунд 2 — агенты читают рассуждения друг друга (не просто итоговые числа) и пересматривают позицию. Финал — взвешивание по уверенности. Приватные данные — это то, что физически мешает агентам прийти к одному ответу. У них разные основания. Им просто не из чего соглашаться.

Почему работает

LLM хорошо следует ролям с чёткими инструкциями и хорошо извлекает выводы из конкретного текста. Проблема в другом: с одинаковым контекстом модель генерирует похожие паттерны рассуждений — сколько агентов ни создавай. Добавь больше шагов рассуждения на плохих данных — получишь более уверенно ошибочный вывод. Приватные срезы создают настоящее разнообразие — не ролевое, а информационное. Обмен рассуждениями важнее обмена числами: рассуждение передаёт логику из приватного среза, которую второй агент иначе никогда не увидел бы. Именно поэтому третий раунд ломает метод — агенты начинают сходиться к консенсусу, разнообразие убивается.

Когда применять

Анализ решений → когда у тебя 6-10+ разрозненных материалов по вопросу (отзывы клиентов, переписки, статьи, рыночные данные), особенно когда нужен честный прогноз без эффекта подтверждения своей точки зрения. Хорошо работает для бизнес-решений (поднять ценник? выйти на рынок?), оценки рисков с несколькими разными источниками, исследовательского анализа. НЕ подходит: для одного документа или одного большого текста — нечего делить; для субъективных оценок вроде «красивый ли дизайн» — разнообразие данных там не критично.

Мини-рецепт

1. Собери источники: нужно минимум 6-9 разных материалов — статьи, отзывы, переписки, данные из разных мест. Один большой документ не считается.
2. Раздели 50/50: половину в общий пул (самые контекстуальные куски), остальное — три уникальных среза по смыслу. Пример: клиентские сигналы / рыночный контекст / отраслевые тренды.
3. Дай осмысленные роли: роль должна отражать характер данных. Не «Эксперт 1», а «Аналитик клиентского опыта».
4. Ровно два раунда: Раунд 1 — независимые прогнозы только из своих данных. Раунд 2 — каждый читает рассуждения двух других и пересматривает или усиливает позицию с объяснением.
5. Взвешивай итог: агентам с крайними оценками и высокой уверенностью — больший вес в финальном выводе.

Примеры

[ПЛОХО] : Проанализируй с трёх точек зрения, стоит ли поднимать ценник. Вот все данные: [отзывы + прайсы конкурентов + статистика рынка — всё в одном блоке]
[ХОРОШО] : Вопрос: стоит ли поднять ставку с 3 000 до 5 000 рублей за текст? Ты играешь роль трёх аналитиков. У каждого — разные данные. ОБЩИЙ КОНТЕКСТ (видят все трое): [статистика рынка копирайтинга, 2-3 куска] АНАЛИТИК 1 — Клиентские сигналы: [отзывы клиентов, переписки про бюджеты] АНАЛИТИК 2 — Рыночное позиционирование: [прайсы конкурентов, посты с ценами] АНАЛИТИК 3 — Отраслевой контекст: [обсуждения в профессиональных чатах, статьи] РАУНД 1. Каждый — независимо: прогноз + вероятность 0-100% + рассуждение из своих данных + уверенность (высокая/средняя/низкая). РАУНД 2. Каждый читает выводы двух других: пересматривает или усиливает позицию с объяснением — что изменилось и почему. ИТОГ: взвешенный вывод, крайним оценкам с высокой уверенностью — больший вес.
Источник: Diverse Evidence, Better Forecasts: Multi-Agent Deliberation Under Information Asymmetry
ArXiv ID: 2607.01661 | Сгенерировано: 2026-07-03 04:46

Проблемы LLM

ПроблемаСутьКак обойти
Мультиперспективный промпт с одинаковыми данными не даёт разных взглядовПросишь модель сыграть трёх экспертов. Даёшь всем одинаковый текст. Получаешь три похожих ответа — не потому что они "договорились", а потому что стартовые данные одинаковые. Ошибки коррелируют: агенты ошибаются вместе, в одну сторону. Больше агентов с одними данными — сильнее убеждают друг друга в одном (неправильном) ответе. Работает для любой задачи где нужно несколько независимых точек зренияРаздели источники по агентам. У каждого — уникальный срез данных. Плюс небольшой общий пул для общего языка. Только тогда агенты физически не могут прийти к одному выводу

Методы

МетодСуть
Информационная асимметрия между ролями — реальное разнообразие позицийРаспредели источники: ~50% общих данных для всех агентов, остальное — уникальные срезы для каждого. Пример разбивки: Агент 1 — [клиентские отзывы], Агент 2 — [данные конкурентов], Агент 3 — [отраслевая статистика]. Раунд 1: каждый агент работает только со своими данными. Даёт прогноз + рассуждение + уровень уверенности. Раунд 2: каждый читает рассуждения других двух. Пересматривает вывод или объясняет почему остаётся при своём. Итог: агентам с высокой уверенностью и крайними оценками — больший вес. Когда работает: есть 6+ разнородных источников для распределения. Когда не работает: один документ или один большой текст — нечего делить

Тезисы

ТезисКомментарий
Агенты должны делиться рассуждениями, а не только выводамиКогда агент говорит только итог ("вероятность 70%") — другие агенты не получают ничего нового. Уникальные данные агента остаются заперты. Когда агент раскрывает рассуждение ("вот почему я так думаю, опираясь на эти данные") — другие агенты фактически получают доступ к его приватному знанию. Механика: вывод без обоснования непрозрачен, рассуждение с источником передаёт контекст. Применяй: в мультиагентном промпте требуй не "дай ответ", а "дай ответ + рассуждение на основе своих источников"
📖 Простыми словами

Diverse Evidence, Better Forecasts: Multi-AgentDeliberation Under Information Asymmetry

arXiv: 2607.01661

Проблема в том, что обычные AI-агенты страдают от информационного конформизма. Когда ты просишь несколько нейронок поспорить друг с другом, но скармливаешь им один и тот же набор данных, никакой дискуссии не получается. Модели просто копируют логику друг друга, потому что у них одинаковый фундамент. Это не консенсус экспертов, а эхо-камера, где три копии одного и того же человека кивают друг другу, совершая одну и ту же ошибку.

Это как если бы ты собрал консилиум врачей, но дал им всем посмотреть только на один рентгеновский снимок левой пятки. Они могут быть гениями, но если у пациента болит голова, их «совещание» — полная херня. Каждый подтвердит диагноз соседа, просто потому что другой инфы не подвезли. В итоге ты получаешь уверенный, но абсолютно неверный прогноз, основанный на стадном эффекте внутри одного промпта.

Чтобы это реально заработало, нужно использовать асимметрию информации. Если ты решаешь, поднимать ли ценник на свои услуги, не давай всем агентам читать твою переписку с клиентами и отзывы одновременно. Пусть один агент изучает только нытье конкурентов в чатах, второй — статистику реальных сделок по рынку, а третий — твои успешные кейсы. Когда у каждого в руках свой уникальный кусок пазла, им приходится реально договариваться и сопоставлять факты, а не просто поддакивать.

Этот метод Multi-Agent Deliberation тестировали на прогнозах, но он применим везде: от бизнес-стратегий до анализа кода. Суть в том, что истина рождается не в споре, а в синтезе разных данных. Если ты хочешь честный ответ, а не «одобрямс» от нейронки, заставь её агентов работать с разными источниками. Только так можно победить корреляцию ошибок, когда все модели дружно лажают в одну сторону.

Короче, хватит кормить AI одинаковыми простынями текста и ждать глубокой аналитики. Хочешь адекватный прогноз — разделяй контекст. Либо ты создаешь искусственный дефицит информации для каждого агента, заставляя их вытаскивать скрытые смыслы, либо получаешь бесполезный хор, который подтвердит любую твою галлюцинацию. Разнообразие данных важнее, чем количество агентов.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с