3,583 papers
arXiv:2601.16130 72 22 янв. 2026 г. PRO

Motivated Reasoning в LLM: почему промпты "будь объективным" не работают

КЛЮЧЕВАЯ СУТЬ
Людям можно сказать 'будь объективным' или 'учитывай что твоя партия поддерживает это' - и они обрабатывают информацию по-разному. Базовые LLM игнорируют эти сигналы. Исследователи дали 7 моделям (GPT-4o mini, Claude 3.5, Gemini 2.0 и др.) и 8558 людям одинаковые политические задачи с мотивационными промптами. Корреляция поведения моделей и людей близка к нулю. Метод показывает что НЕ работает и даёт три альтернативы: (1) запрашивай разнообразие явно через роли вместо 'будь объективным', (2) разделяй оценку аргументов и формирование мнения на отдельные запросы, (3) генерируй 5-10 ответов подряд если нужен разброс как у людей. Фишка: у LLM нет внутренней мотивационной системы - партийность, ценности, желание выглядеть последовательным. Модель обучена предсказывать средний ответ из агрегата мнений. Абстрактные сигналы 'будь объективным' для неё просто слова в контексте, не триггеры поведения.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с