3,583 papers
arXiv:2512.20022 76 22 дек. 2025 г. PRO

Actor-Critic Screening: двойная проверка решений через две модели

КЛЮЧЕВАЯ СУТЬ
Критиковать чужое решение модели легче, чем принимать своё с нуля — на этом построен метод Actor-Critic для задач отбора. Одиночные LLM показывают плохую калибровку (уверенность 0.95 и ошибка VS уверенность 0.6 и правота) и непоследовательность (от 31% до 100% чувствительности на одних данных в зависимости от структуры промпта). Решение: первая модель принимает решение по чек-листу критериев (actor), вторая независимо проверяет его (critic) с полным доступом к первому решению, обоснованию и уверенности. Правило агрегации определяет финал: хоть одна «за» → включить (any-include), обе «за» → включить (consensus), или critic имеет право вето. Результат: выше AUC (дискриминация) и ниже Brier score (калибровка) в обоих литобзорах, две лёгкие модели разнесли одну тяжёлую по качеству и стоили дешевле.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с