3,583 papers
arXiv:2512.01786 70 1 дек. 2025 г. PRO

LLM Jury-on-Demand: динамическое жюри LLM-судей для оценки качества текстов

КЛЮЧЕВАЯ СУТЬ
LLM-судья может отлично оценить 100 текстов и провалить 20, но ты не узнаешь заранее какие именно 20. Проблема в том, что надёжность судьи зависит от контекста — одна модель хороша на коротких новостях, плывёт на длинных технических текстах. Статическое жюри (одни и те же судьи для всех) игнорирует эту вариативность. LLM Jury-on-Demand позволяет получать надёжные оценки качества текстов, собирая для каждого случая своё жюри. Фишка: система предсказывает надёжность каждого судьи для данного конкретного текста → отбирает топ-K самых надёжных → взвешивает их голоса по уровню предсказанной надёжности. Жюри меняется от текста к тексту.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с