3,583 papers
arXiv:2602.12150 74 12 фев. 2026 г. PRO

Theory of Mind в LLM: три теста показывают отсутствие понимания людей

КЛЮЧЕВАЯ СУТЬ
Парадокс: GPT-4o точно предсказывает действия людей в знакомых задачах, но при переформулировке той же логики в другой формат – ответы слабо коррелируют (r=0.48). Исследователи из Yale проверили не «похожи ли ответы на человеческие», а есть ли у модели единые принципы понимания как убеждения и желания приводят к действиям. Результат: модель провалила 2 из 3 тестов. Техника позволяет диагностировать надёжность логики через переформулировку – задай логически ту же задачу в другом формате (коробки с фруктами → киносеансы). Если ответы противоречат – модель не понимает принципов, а подгоняет под поверхностные признаки формулировки. Социальная компетентность LLM – это статистика, а не понимание.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с