3,583 papers
arXiv:2601.00730 73 2 янв. 2026 г. PRO

Многоэтапная оценка с референсом: снижение вариативности и предвзятости LLM-оценщиков

КЛЮЧЕВАЯ СУТЬ
LLM имеет встроенный позитивный bias при оценке чужих работ — без чётких ориентиров тянет оценки вверх, избегает низких баллов ("старался же человек"). Это наследие RLHF-обучения на человеческих предпочтениях: людям нравились поддерживающие, мягкие ответы. Метод позволяет получать калиброванные объективные оценки текстов, работ подрядчиков, идей — с точностью ≈8 баллов от экспертной оценки. Три защитных слоя: (1) референсное решение как якорь калибровки вместо оценки "из воздуха", (2) ансамбль из 3 независимых оценщиков снижает случайный дрейф, (3) пронумерованные критерии [R1], [R2] с обязательным цитированием убирают субъективность. Результат: стабильные аудируемые оценки вместо размытых "хорошо/нормально".
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с