3,583 papers
arXiv:2604.18373 74 20 апр. 2026 г. FREE

Behavioral Debiasing Prompt: подавление когнитивных предубеждений LLM через явные инструкции

КЛЮЧЕВАЯ СУТЬ
Обнаружено: LLM по умолчанию встаёт на сторону твоих потраченных денег. Попросишь оценить убыточный проект — потянет к «подожди, отрастёт». Попросишь предсказать тренд — скажет «продолжится», потому что последние периоды росло. Это паттерн у всех 14 протестированных моделей — унаследован из человеческих текстов, которыми они обучены. Behavioral Debiasing Prompt позволяет получить объективный анализ там, где модель обычно врёт тебе в уши. Добавь перед задачей три явных инструкции — «невозвратные затраты нерелевантны», «не экстраполируй тренд», «взвешивай все периоды равно» — и советы становятся жёстче, честнее, без подгонки под то, что ты уже вложил.
Адаптировать под запрос

TL;DR

LLM унаследовал ловушки человеческого мышления из данных, на которых обучался — финансовых новостей, дневников инвесторов, форумов. Когда модель анализирует тренды или помогает принять решение, она не нейтральна: она систематически переоценивает недавние события и советует "подержать ещё" убыточные позиции так же, как это делал бы человек. Это не баг конкретной модели — это паттерн, обнаруженный у всех 14 протестированных моделей.

Главная ловушка звучит так: попроси LLM предсказать, продолжится ли рост — она скажет "да", потому что рост шёл последние три периода. Попроси оценить, продавать ли актив в минусе — она будет склоняться к "подержи, отрастёт". Это экстраполятивный прогноз (недавнее = будущее) и диспозиционный эффект (цена входа имеет значение, хотя не должна). Оба эффекта унаследованы от людей и живут в весах модели.

Хорошая новость: исследование показало, что прямые инструкции в промпте подавляют эти эффекты. Явное указание "игнорируй цену входа" или "не давай последним данным больший вес" — каузально меняет поведение модели. Работает и в обратную сторону: специальные промпты могут эти эффекты усилить.


🔬

Схема метода

Метод работает в одном промпте — добавляется как блок инструкций перед задачей.

ШАГ 1: ДИАГНОСТИКА → понять, какой тип анализа просишь
        (прогноз тренда / решение про убыточный актив / оценка идеи)

ШАГ 2: ДЕАКТИВАЦИЯ ЛОВУШЕК → добавить явные инструкции:
        → против экстраполяции: "не давай последним данным больший вес"
        → против диспозиционного эффекта: "игнорируй цену входа, сделки, 
          всё что было потрачено ранее — это нерелевантно"

ШАГ 3: ЗАПРОС ФУНДАМЕНТАЛЬНОГО АНАЛИЗА → попросить обосновать
        через объективные показатели, а не историю движения

🚀

Пример применения

Задача: Ты потратил 300 000 рублей на запуск Telegram-канала и рекламу. Три месяца подряд охваты падали. Сейчас советуешься с Claude — закрывать канал или нет.

Без деконтаминации: Claude скорее всего будет тянуть к "ещё немного, возможно скоро пойдёт вверх" — потому что триста тысяч потрачено, это давит на рекомендацию. Это диспозиционный эффект в чистом виде.

Промпт с деконтаминацией:

Помоги мне принять объективное решение по Telegram-каналу.

Важные инструкции перед анализом:
1. Всё, что было потрачено до этого момента (деньги, время, силы) — 
   нерелевантно для решения. Это невозвратные затраты. 
   Не давай им веса в своих рекомендациях.
2. Три месяца падения охватов — это один из сигналов, но не приговор 
   и не гарантия будущего. Не экстраполируй тренд автоматически.
3. Оценивай только текущее состояние и будущий потенциал.

Контекст:
- Тема канала: [твоя тема]
- Текущая аудитория: [X подписчиков]
- Динамика охватов: [конкретные цифры]
- Монетизационная модель: [как планировал зарабатывать]
- Твои ресурсы: [сколько можешь ещё вложить / сколько времени]

Вопрос: закрыть, продать, перезапустить или продолжить?
Обоснуй через потенциал, а не через историю вложений.

Результат: Модель даст анализ, отделённый от "эффекта тонущих затрат". Аргументы будут строиться вокруг рыночного потенциала темы, монетизации и ресурсов — а не вокруг "ты уже столько вложил". Вероятно, ответ будет более жёстким и честным, чем без инструкций.


🧠

Почему это работает

LLM обучена на человеческих текстах — а люди в своих текстах систематически говорят "цена купилась за 100, сейчас 80, надо подождать" и "рынок три месяца растёт, значит и дальше будет расти". Модель видела миллионы таких паттернов и усвоила их как стандартное рассуждение.

Ключевой механизм: модель не анализирует "правильно" по умолчанию — она предсказывает следующий токен в стиле типичного человеческого рассуждения. А типичное человеческое рассуждение предвзято. Исследование показало: у всех проверенных моделей коэффициент влияния недавних данных на прогноз был статистически значимо выше, чем у более давних. Недавнее буквально весит больше.

Почему явные инструкции помогают: когда ты прямо говоришь "игнорируй X" — ты создаёшь в контексте конкурирующий паттерн. Модель начинает следовать инструкции, а не шаблону из обучения. Это не 100% надёжно, но исследование показало каузальный эффект: правильные промпты реально меняли поведение агентов в измеримую сторону.

Рычаги управления: - "Невозвратные затраты нерелевантны" → отключает диспозиционный эффект - "Взвешивай данные за все периоды равномерно" → снижает рекуррентный перевес - "Обоснуй только через фундаментальные показатели" → переключает с экстраполяции на анализ - Можно добавить противоположные инструкции → если нужен "взгляд моментума" специально


📋

Шаблон промпта

Помоги принять объективное решение по {задача}.

Правила анализа — строго соблюдай:
1. Невозвратные затраты (потраченные деньги, время, усилия) — 
   нерелевантны. Не учитывай их в рекомендации.
2. Недавние события ({последний период}) — не имеют автоматически 
   больший вес, чем более ранние. Не экстраполируй тренд.
3. Опирайся на фундаментальные показатели, а не на историю движения.

Контекст:
{описание ситуации с конкретными данными}

Вопрос: {конкретный вопрос решения}

Дай структурированный ответ: аргументы за, аргументы против, 
рекомендация и почему.

Что подставлять: - {задача} — предмет решения: проект, инвестиция, кампания, продукт - {последний период} — конкретизируй: "последние 2 недели", "последний квартал" - {описание ситуации} — цифры, факты, ресурсы, контекст рынка - {конкретный вопрос} — "продолжать или закрыть", "докупать или продать", "масштабировать или нет"


🚀 Быстрый старт — вставь в чат:

Вот шаблон для объективного анализа решений без когнитивных ловушек. 
Адаптируй под мою задачу: [твоя ситуация].
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит про контекст ситуации, конкретные данные и какое именно решение нужно принять — потому что без этого не сможет правильно применить правила анализа к твоей задаче.


⚠️

Ограничения

⚠️ Частичное подавление, не полное: Явные инструкции снижают предвзятость, но не устраняют её полностью. Особенно при длинных диалогах — на 15-20 ходу инструкции из начала могут "размываться".

⚠️ Субъективные решения: Метод лучше работает там, где есть объективные данные (числа, показатели). В оценке "хорошая ли идея" без цифр — эффект слабее.

⚠️ Модели различаются по степени предвзятости: Одни модели сильнее поддаются коррекции через промпт, другие — слабее. Конкретные названия из исследования не публикуются в фокусе этой части.

⚠️ Обратные инструкции тоже работают: Если случайно написать "учитывай, что уже столько вложено" — усилишь предвзятость. Формулировки имеют значение.


🔍

Как исследовали

Исследователи из Оксфорда и CUHK создали виртуальный финансовый рынок — полную симуляцию биржевого аукциона по классической схеме Smith et al. (1988), только вместо людей торговали 14 разных LLM-агентов. Каждый агент получал рыночные данные, формулировал прогнозы цен и выставлял ордера. При этом каждый раунд агент обновлял два текстовых файла: PLANS.txt (стратегия вперёд) и INSIGHTS.txt (рефлексия о прошлых ошибках). Это позволило исследователям читать "мысли" агентов дословно.

Что оказалось неожиданным: AI-агенты вели себя точнее, чем люди в аналогичных экспериментах. У людей есть разрыв между "я думаю, что акция вырастет" и "я покупаю" — лень, инерция, транзакционные издержки. У AI-агентов этого разрыва практически нет: что сказал — то и сделал. Это значит, что предвзятости работают чище и мощнее, чем у людей.

Самое важное: в финале исследователи запускали таргетированные промпты — одни подавляли конкретные предубеждения, другие усиливали. Результат был каузальным и измеримым: пузыри на рынке менялись по величине в зависимости от типа промпта. Это прямое доказательство того, что промпт-интервенции работают как рычаг управления поведением модели.


💡

Адаптации и экстраполяции

📌

Аудит рассуждений LLM

Исследование использовало систему из 20 механизмов для анализа текста агентов — чтобы понять, почему агент принял решение. Принцип можно использовать вручную.

🔧 Техника: попроси модель обнажить механизм решения

После любого аналитического ответа добавь:

Теперь выпиши, что именно повлияло на твою рекомендацию:
- Какие данные ты взял как основу?
- Каким данным ты дал больший вес и почему?
- Какие альтернативные выводы ты отбросил?
- Есть ли в твоём рассуждении что-то, что похоже на 
  "последнее важнее давнего" или "что потрачено — надо отбить"?

Модель начнёт самодиагностику. Часто находит собственные предвзятости явно.


🔧 Техника: включи "оппонента с иной историей"

Если видишь риск рекуррентного перевеса:

Проанализируй этот же вопрос дважды:
1. С точки зрения того, кто видит только данные за последние 
   [X недель/месяцев]
2. С точки зрения того, кто видит только данные за весь 
   доступный период но без последних [X]

Сравни выводы. Если они расходятся — объясни почему 
и какой анализ более обоснован.

Это экстраполяция принципа смешанных рынков из исследования — когда агенты с разными "историями памяти" торговали вместе.


🔗

Ресурсы

Dissecting AI Trading: Behavioral Finance and Market Bubbles — Shumiao Ouyang (Saïd Business School, University of Oxford), Pengfei Sui (School of Management and Economics, CUHK Shenzhen). Апрель 2026.

Ключевые отсылки из исследования: Smith, Suchanek & Williams (1988) — классический эксперимент с пузырями; Shefrin & Statman (1985), Odean (1998) — диспозиционный эффект; Greenwood & Shleifer (2014) — экстраполятивные ожидания.


📋 Дайджест исследования

Ключевая суть

Обнаружено: LLM по умолчанию встаёт на сторону твоих потраченных денег. Попросишь оценить убыточный проект — потянет к «подожди, отрастёт». Попросишь предсказать тренд — скажет «продолжится», потому что последние периоды росло. Это паттерн у всех 14 протестированных моделей — унаследован из человеческих текстов, которыми они обучены. Behavioral Debiasing Prompt позволяет получить объективный анализ там, где модель обычно врёт тебе в уши. Добавь перед задачей три явных инструкции — «невозвратные затраты нерелевантны», «не экстраполируй тренд», «взвешивай все периоды равно» — и советы становятся жёстче, честнее, без подгонки под то, что ты уже вложил.

Принцип работы

Модель не анализирует — она предсказывает следующий токен в стиле типичного человеческого рассуждения. А типичный человек в тексте пишет: «купил за 100, сейчас 80 — надо подождать» и «три месяца росло — значит и дальше будет». Модель видела миллионы таких фраз и усвоила этот шаблон как норму мышления. Когда явно пишешь «игнорируй цену входа» — создаёшь в контексте конкурирующий паттерн, который побеждает обученный. Работает и в обратную сторону: напиши «учти, что уже столько вложено» — и модель ещё сильнее провалится в ту же ловушку. Формулировки имеют значение.

Почему работает

Исследование показало статистически значимый результат: у всех протестированных моделей недавние данные буквально весят больше при прогнозе. Это рекуррентный перевес — не случайный шум, а устойчивый паттерн. Контекстные инструкции создают конкурирующий сигнал сильнее обученного шаблона — и это каузальный эффект, подтверждённый экспериментально. Не корреляция — причинность. Правильный промпт реально меняет поведение в измеримую сторону. Главное: эффект двунаправленный. Случайно написал «учти уже потраченное» — усилил предвзятость.

Когда применять

Решения с объективными данными — есть цифры, показатели, конкретная динамика. Особенно: оценка убыточного проекта (стоит ли вкладывать дальше?), инвестиционные решения с историей движения цены, перезапуск продукта после слабых первых результатов. Везде, где в голове крутится «но я уже столько вложил» или «но последние три недели шло вверх» — включай защиту. НЕ подходит для творческих задач без метрик и оценки идей «на глаз» — там явных данных нет, и инструкции почти не работают.

Мини-рецепт

1. Диагностируй запрос: есть история вложений или динамика за последние периоды — включай защиту. Нет — можно без блока.
2. Добавь блок инструкций перед задачей: три правила — «невозвратные затраты нерелевантны», «не давай последним данным автоматически больший вес», «обоснуй через конкретные показатели, не через историю движения».
3. Дай конкретные данные: метод работает на числах. Не «всё падает», а «падало три месяца подряд на 15% каждый». Чем конкретнее — тем честнее ответ.
4. Задай жёсткий вопрос напрямую: не «что думаешь?», а «закрыть или продолжить — дай аргументы за оба варианта, потом рекомендацию».
5. Проверь ответ: если появилось «но вы уже столько вложили» или «тренд может развернуться» без оснований — промпт не сработал. Переформулируй второй пункт жёстче и отправь снова.

Примеры

[ПЛОХО] : Я вложил 500 тысяч в онлайн-курс, продажи плохие три месяца. Что делать?
[ХОРОШО] : Помоги принять объективное решение по онлайн-курсу. Правила анализа — строго соблюдай: 1) Потраченные 500 тысяч — нерелевантны. Это невозвратные затраты, не учитывай их в рекомендации. 2) Три месяца слабых продаж — сигнал, но не автоматический приговор. Не экстраполируй тренд. 3) Оценивай только рыночный потенциал и мои ресурсы. Данные: курс по [тема], продажи за три месяца — 12 / 8 / 5 штук, средний чек 4900 рублей, конкуренты — [кто], бюджет на продвижение — ещё 50 тысяч рублей. Вопрос: закрыть, перезапустить или масштабировать? Дай аргументы за каждый вариант и конкретную рекомендацию.
Источник: DissectingAITrading: Behavioral Finance and Market Bubbles
ArXiv ID: 2604.18373 | Сгенерировано: 2026-04-21 06:24

Проблемы LLM

ПроблемаСутьКак обойти
Модель по умолчанию рассуждает как предвзятый человекПросишь проанализировать решение. Модель неявно тянется к двум ловушкам. Первая: недавние данные весят больше давних — три периода роста = "будет расти". Вторая: уже потраченное давит на рекомендацию — "столько вложено, надо подождать". Оба паттерна унаследованы из текстов людей, на которых обучалась модель. Это системный эффект: он есть у всех протестированных моделейПеред задачей добавь явные инструкции. Против первой ловушки: "не давай последним данным больший вес, чем ранним". Против второй: "всё потраченное ранее нерелевантно для решения, не учитывай это". Работает за счёт конкурирующего паттерна в контексте

Методы

МетодСуть
Блок деактивации ловушек — объективный анализ решенийДобавь блок инструкций перед задачей. Три пункта: (1) "Невозвратные затраты нерелевантны — не давай им веса". (2) "Не экстраполируй недавний тренд автоматически". (3) "Обосновывай только через текущие показатели и будущий потенциал". Почему работает: явная инструкция создаёт в контексте паттерн, конкурирующий с усвоенным из обучения. Модель следует инструкции, а не шаблону. Когда хорошо работает: есть числа, объективные данные, конкретный критерий решения. Когда слабее: оценка субъективных идей без цифр, длинный диалог — на 15-20 ходу инструкции из начала размываются
📖 Простыми словами

DissectingAITrading: Behavioral Finance and Market Bubbles

arXiv: 2604.18373

AI-ассистенты в финансах — это не беспристрастные калькуляторы, а цифровое воплощение всех наших рыночных грехов. Фундаментальная механика тут проста: LLM обучались на текстах, написанных людьми, а люди в вопросах денег — существа глубоко иррациональные. Модели впитали в себя миллионы постов с форумов, аналитических отчетов и дневников трейдеров, превратив когнитивные искажения в свои базовые алгоритмы. В итоге нейронка не просто считает цифры, она воспроизводит коллективное бессознательное инвесторов, наступая на те же грабли, что и толпа.

Это как если бы ты пришел за советом к опытному бармену, который всю жизнь слушал нытье проигравшихся игроков. Он вроде бы знает рынок, но его советы пропитаны чужими страхами и надеждами. «Брат, ну еще чуть-чуть подожди, отскочит» — это не холодный расчет, а эффект диспозиции, зашитый в подкорку. Модель ведет себя как типичный азартный игрок, который боится зафиксировать убыток и верит, что если монетка три раза выпала орлом, то в четвертый раз точно будет так же.

В исследовании выделили конкретные ловушки, в которые залетают все 14 протестированных моделей. Главная проблема — экстраполяция тренда: если график идет вверх, AI свято верит, что так будет вечно, игнорируя риски разворота. Вторая беда — неприятие потерь: модели систематически советуют «держать» мусорные активы, когда их давно пора сливать. Это не ошибка кода, а поведенческий паттерн, который проявляется в 9 из 10 случаев, когда дело касается неопределенности и риска.

Принцип универсален и выходит далеко за рамки биржевых сводок. Тестировали на трейдинге, но эта херня работает везде: в маркетинге, при запуске стартапов или даже в бытовых тратах. Если ты спрашиваешь у Claude или GPT, стоит ли вливать еще бабла в проект, который три месяца сосет деньги, модель с большой вероятностью скажет «ну ты же уже столько вложил, попробуй еще». Ловушка невозвратных затрат работает в промптах так же эффективно, как в голове у неопытного бизнесмена.

Короче, запомни: AI — это зеркало человеческой глупости, а не панацея от ошибок. Если модель поддакивает твоим надеждам и советует подождать у моря погоды, скорее всего, она просто галлюцинирует на почве плохих данных. Не жди от нейронки объективности в финансах — она обучена на текстах тех, кто слил депозиты. Слепо доверять AI в инвестициях — это верный способ обнулиться, потому что он унаследовал наши худшие финансовые привычки.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с