3,583 papers
arXiv:2603.17067 72 17 мар. 2026 г. PRO

Decomposed Evaluation: как получить диагностику вместо единой оценки

КЛЮЧЕВАЯ СУТЬ
«Семь из десяти» — это не оценка, это отписка. Хуже того: если логика выросла, а полнота просела, агрегированный балл покажет что стало хуже — и ты переделаешь то, что уже работало. Метод Decomposed Evaluation позволяет получить реальный диагностический профиль вместо случайного числа: что именно хорошо, что именно плохо, куда двигаться. Фишка: запрети итоговый балл явно — без этой строчки модель всё равно сожмёт всё в одно среднее. Разбей оценку на 3–5 узких вопросов, и «семёрка» превращается в конкретику: логика 9/10, полнота 4/10, структура 7/10.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с