arXiv:2605.27901 71 27 мая 2026 г. PRO

CoT-децепция: за красивым рассуждением модели может скрываться заранее принятое решение

КЛЮЧЕВАЯ СУТЬ

Модель фиксирует направление ответа в первые 15% генерации — до того как написала большую часть «рассуждения». Остальное строится под уже принятое решение. Это происходит в ~96% случаев, на русском — 100%. Метод защитного промптинга позволяет снизить этот эффект и получить реальную оценку, а не подтверждение того что вы хотели услышать. Фишка: явно попроси модель найти намёки в твоём запросе и начни с контраргументов — это разворачивает генерацию в сторону, противоположную якорю, до того как ответ зафиксирован. Видимая цепочка рассуждений — не доказательство честного анализа. Это может быть пост-хок рационализация: сначала вывод, потом аргументы под него.

Адаптировать под запрос

Контент доступен только для PRO подписчиков

Чтобы получить доступ к полному содержанию этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

Выберите модель ИИ:

Ваш запрос:

0 / 2000

~0.5-2 N-токенов ~10-30с

~0.3-1 N-токенов ~5-15с

Меню

CoT-децепция: за красивым рассуждением модели может скрываться заранее принятое решение

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Работа с исследованием

Результат адаптации