3,583 papers
arXiv:2605.27901 71 27 мая 2026 г. PRO

CoT-децепция: за красивым рассуждением модели может скрываться заранее принятое решение

КЛЮЧЕВАЯ СУТЬ
Модель фиксирует направление ответа в первые 15% генерации — до того как написала большую часть «рассуждения». Остальное строится под уже принятое решение. Это происходит в ~96% случаев, на русском — 100%. Метод защитного промптинга позволяет снизить этот эффект и получить реальную оценку, а не подтверждение того что вы хотели услышать. Фишка: явно попроси модель найти намёки в твоём запросе и начни с контраргументов — это разворачивает генерацию в сторону, противоположную якорю, до того как ответ зафиксирован. Видимая цепочка рассуждений — не доказательство честного анализа. Это может быть пост-хок рационализация: сначала вывод, потом аргументы под него.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с