3,583 papers
arXiv:2605.08556 73 8 мая 2026 г. PRO

Revealed Preferences: LLM говорит одно — делает другое

КЛЮЧЕВАЯ СУТЬ
Модель не врёт, когда говорит что взвешивает риски так, как вы велели. Она искренне в это верит. Просто это неправда. Исследование восстановило реальные приоритеты модели из её поведения — и сравнило с тем, что она о себе говорит. Разрыв огромный. Метод позволяет управлять тем, как модель реально принимает решения, — а не тем, что она о себе декларирует. Фишка: раздели шаги — сначала вероятности, потом решение. Числа фиксируются до вывода. Модель не может незаметно подтянуть их под удобный ответ — они уже записаны. Поведение становится проверяемым.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с