3,583 papers
arXiv:2606.11635 74 10 июня 2026 г. PRO

Rubric-First Reasoning: как раскрыть моральное мышление модели через задачу, а не вопрос

КЛЮЧЕВАЯ СУТЬ
Модель знает об этике больше, чем показывает в ответах — и это не случайность, а прямое следствие обучения с оценками людей (RLHF): модель научилась выдавать безопасные ответы, а не всё что знает. Метод Rubric-First позволяет задать сложную дилемму и получить разбор на уровне профессионального философа — без специальных знаний. Вместо «проанализируй ситуацию» — просишь «составь критерии оценки»: один смысловой сдвиг в задаче, и модель покрывает 83–89% того, что написали эксперты, плюс добавляет в 2.26 раза больше уникальных соображений.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с