arXiv:2603.05167 74 5 мар. 2026 г. PRO

Как AI оценивает чужие рассуждения: три слепых пятна, которые нужно знать

КЛЮЧЕВАЯ СУТЬ

AI-критик работает как детектив с плохой памятью: ошибку почувствует почти всегда — точность 82–94%. Но точно покажет где именно — только в 56–68% случаев. Разрыв в 26 процентных пунктов между 'заметил' и 'нашёл' — это не баг конкретной модели, это системная картина. Плюс второй сюрприз: полноту рассуждений AI завышает всегда — даже когда удалено 70% шагов, средняя оценка около 3 из 4. Метод попарной проверки позволяет обойти обе ловушки и получать от AI честную и точную критику цепочек рассуждений. Фишка: вместо 'оцени всё' — серия точечных вопросов 'следует ли шаг N+1 из шага N?' Модель перестаёт читать нарратив целиком и работает с конкретными парами — точность локализации ошибок резко растёт.

Адаптировать под запрос

Контент доступен только для PRO подписчиков

Чтобы получить доступ к полному содержанию этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

Выберите модель ИИ:

Ваш запрос:

0 / 2000

~0.5-2 N-токенов ~10-30с

~0.3-1 N-токенов ~5-15с

Меню

Как AI оценивает чужие рассуждения: три слепых пятна, которые нужно знать

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Работа с исследованием

Результат адаптации