3,583 papers
arXiv:2606.21861 72 20 июня 2026 г. PRO

Rubric-Anchored Evaluation: формулировка оценочного промпта меняет точность AI на 30–53 пункта

КЛЮЧЕВАЯ СУТЬ
Шкала «от 1 до 4» без объяснений — ловушка. Оценки «2» и «3» в пространстве значений модели разделены косинусным сходством 0.07. Это практически ноль — модель физически не видит разницы и съезжает к «средним» значениям по умолчанию. Рубрика с поведенческими якорями позволяет получать надёжную AI-оценку чего угодно по шкале — постов, питчей, резюме, заявок — вместо усреднённой каши. Фишка: переформулируй каждый уровень шкалы через конкретные поведенческие признаки — и задача из «угадай абстрактный балл» превращается в «найди конкретные маркеры». Согласованность результатов вырастает с 0.10 (случайное угадывание) до 0.60, точность — на 30–53 процентных пункта.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с