3,583 papers
arXiv:2512.07898 80 5 дек. 2025 г. PRO

MARINE: итеративное улучшение одного ответа через многоагентную разведку

КЛЮЧЕВАЯ СУТЬ
Обнаружено: single-agent self-refine проваливается из-за Degeneration-of-Thought — когда модель уверилась в решении, она не видит собственных ошибок, даже если явно просишь "найди проблемы". MARINE позволяет превратить pass@N способность модели в pass@1 — вместо генерации N независимых ответов и выбора лучшего, метод создаёт одну опорную траекторию и итеративно улучшает её через команду агентов-критиков. На каждом раунде несколько агентов с разными ролями (юрист, финансист, маркетолог) ищут локальные ошибки в своей зоне — лучшие правки сшиваются в обновлённую версию. Результат: монотонное улучшение качества вместо лотереи Best-of-N.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с