3,583 papers
arXiv:2512.00617 74 29 нояб. 2025 г. PRO

ART (Adaptive Response Tuning): турнир LLM-агентов с ELO-рейтингом

КЛЮЧЕВАЯ СУТЬ
Обнаружено: Одна модель не знает качество своего ответа — пишет галлюцинации с той же уверенностью, что и факты. Вы не видите была ли это топ-10% попытка или худшие 30%. Метод ART позволяет отсеять плохие ответы ДО того, как вы их увидели — через турнир нескольких агентов с взаимной критикой. Фишка: LLM плохо оценивает СВОЙ текст, но отлично критикует ЧУЖОЙ. Турнир запускает 3-5 агентов, они генерируют ответы, критикуют друг друга по 4 критериям (точность, связность, полнота, релевантность), получают ELO-рейтинг как в шахматах, лучшие части объединяются в консенсусный ответ. Три независимые попытки + фильтр через критику = выше вероятность попасть в качественный результат.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с