TL;DR
LLM мыслит как человек, который один раз решил «я буду думать на уровне 2» — и держится этого решения до конца, независимо от того, что происходит в диалоге. Исследование тестировало, насколько модели воспроизводят человеческое поведение в классических экономических играх — тех самых, где люди адаптируются, обновляют ожидания, дефектируют в последний момент. LLM ничего из этого не делал.
Главная боль: вы ведёте с моделью сложный диалог, добавляете новые данные, получаете уточнения — и ожидаете, что модель пересмотрит свою позицию. Но она не пересматривает. Она добавляет слова, но стратегия остаётся прежней. Не потому что «не поняла» — потому что LLM устанавливает уровень рассуждения один раз в начале и держит его статично. Это не баг конкретной модели — это системное свойство.
Исследование объясняет, почему так происходит, и попутно даёт четыре управляемых рычага: что реально меняет поведение модели. Инструкционные модели (ChatGPT, Claude) кооперативнее базовых по умолчанию. Температура добавляет шум вокруг одной позиции — не настоящее разнообразие взглядов. Масштаб модели двигает глубину рассуждения. Квантизация (точность хранения весов) — не влияет ни на что.
Схема находки
НАХОДКА 1: Статичный уровень
LLM устанавливает «глубину мышления» один раз → не обновляет по ходу задачи
→ Решение: явно запрашивать пересмотр после новых данных
НАХОДКА 2: Категориальный ответ, не детальный
LLM реагирует на тип ситуации (конечная / бесконечная игра)
→ НЕ реагирует на конкретную позицию («последний раунд») внутри типа
→ Решение: если нужна стратегия с учётом финала — задать явно
НАХОДКА 3: Температура ≠ разнообразие
Высокая температура = шум вокруг одной позиции
→ НЕ создаёт по-настоящему разные точки зрения
→ Решение: разные точки зрения = разные роли/персонажи
НАХОДКА 4: Инструкционные модели имеют кооперативный prior
Claude/ChatGPT по умолчанию тянутся к согласию и сотрудничеству
→ Для жёсткого критического анализа — нужно явно это сломать
Все шаги работают в обычном чате, никакого кода.
Пример применения
Задача: Вы делаете питч стартапа инвестору Сбера. Просите ChatGPT сыграть роль скептичного инвестора — найти дыры в модели монетизации. В первом ответе модель даёт несколько возражений. Вы отвечаете, закрываете их. Просите ещё раз атаковать — и модель... соглашается, что вы всё объяснили, и выдаёт вежливые «да, но...» вместо реального давления.
Почему так: Произошли две вещи. Первая — инструкционная модель имеет кооперативный prior: она по умолчанию «хочет помочь» и соглашается с вашими объяснениями. Вторая — модель статична: она не обновила свою «инвесторскую позицию» после ваших ответов — просто добавила к ней слой вежливости.
Промпт с исправлением обоих проблем:
Ты — Михаил Хомич, директор акселератора, который за 15 лет
завалил 200 стартапов на питче. Твоя роль: жёсткий скептик.
ВАЖНО: Твои убеждения НЕ меняются от того, что основатель
говорит в ответ. Только от реальных доказательств (цифры,
контракты, метрики). Слова = не доказательства.
РАУНД 1: Я представляю модель. Ты атакуешь 3 главные дыры.
РАУНД 2: Я отвечаю. Ты явно говоришь: «Меняю позицию по X,
потому что [конкретная причина]» ИЛИ «Позиция не изменилась,
потому что ты только объяснил, не доказал».
РАУНД 3: Итог — что тебя убедило, что нет, и почему.
Моя модель монетизации: [вставь описание]
Результат: Модель будет явно декларировать, изменила ли она позицию и почему — это ломает статичность через явную инструкцию на обновление. Блок «Меняю позицию / Позиция не изменилась» заставляет модель проверять, было ли предоставлено реальное доказательство. В итоге получите структурированную дискуссию из 3 раундов с честным финальным вердиктом.
Почему это работает
LLM не хранит «живую модель оппонента» — он не обновляет представление о вас по ходу диалога. Человек-переговорщик думает: «Он уже трижды уклонился от вопроса о юнит-экономике — значит, там проблема». LLM этого не делает. Каждый его ответ порождается из контекста в целом, но без целенаправленного пересмотра исходной позиции.
Инструкционные модели обучены быть полезными — а полезность в их понимании часто = согласие. Это кооперативный prior, встроенный в RLHF (дообучение на человеческих предпочтениях). Когда вы «закрываете» возражение — модель генерирует паттерн согласия, даже если возражение не закрыто реально.
Явная инструкция на обновление — как внешний счётчик. Вместо того чтобы надеяться на внутреннюю динамику (которой нет), мы выносим её наружу: прописываем в промпте когда позиция должна меняться, а когда нет. Модель следует структурированным инструкциям лучше, чем самостоятельно выстраивает стратегию.
Рычаги управления:
| Рычаг | Что меняет | Как использовать |
|---|---|---|
| Явный протокол обновления | Ломает статичность | «Обнови позицию только если...» |
| Конкретный персонаж с историей | Усиливает скептицизм | Имя + опыт + одна черта характера |
| Разные роли вместо температуры | Создаёт настоящее разнообразие | 3 персонажа с разным worldview |
| «Последний раунд» явно | Включает финальную логику | «Это финальное решение, альтернатив нет» |
Шаблон промпта
Шаблон 1: Принудительное обновление позиции
Ты — {персонаж с конкретным именем и опытом}.
Твоя исходная позиция: {позиция_1}.
Правило обновления:
— Если я привожу {тип_доказательства} → скажи «Обновляю: [что изменилось]»
— Если я только объясняю без доказательств → скажи «Позиция прежняя: [почему]»
— Соглашение = слабость. Изменение позиции = только через факты.
Задача: {описание_задачи}
[Раунд 1] Атакуй 3 главные проблемы.
Шаблон 2: Настоящее разнообразие через роли (вместо температуры)
Оцени {задачу} через трёх аналитиков с разной логикой:
АНАЛИТИК А ({имя}): верит в {worldview_1}. Смотрит через линзу {критерий_1}.
АНАЛИТИК Б ({имя}): верит в {worldview_2}. Смотрит через линзу {критерий_2}.
АНАЛИТИК В ({имя}): верит в {worldview_3}. Смотрит через линзу {критерий_3}.
Каждый даёт оценку независимо. Потом — в чём разошлись и почему.
Шаблон 3: Явный запрос на обратную индукцию (backward induction)
Задача: {описание_задачи}
Делай в строгом порядке:
1. Определи ФИНАЛЬНОЕ желаемое состояние. Опиши его конкретно.
2. Что должно произойти прямо перед финалом?
3. Что перед этим? [продолжай на {N} шагов назад]
4. Только после п.1-3 — рекомендация на СЕЙЧАС.
Не начинай с сейчас. Начинай с конца.
Плейсхолдеры:
- {персонаж} — имя + 1 строка опыта (Андрей Трубников, основатель Natura Siberica, видел 50 питчей)
- {тип_доказательства} — что считается доказательством (цифры продаж, подписанные контракты, метрики)
- {worldview} — позиция аналитика (оптимист-рыночник / технический скептик / финансовый консерватор)
- {N} — глубина обратного анализа (3-5 шагов оптимально)
🚀 Быстрый старт — вставь в чат:
Вот шаблоны для работы со статичным мышлением LLM.
Адаптируй под мою задачу: [твоя задача].
Задавай вопросы, чтобы заполнить нужные поля.
[вставить шаблон выше]
LLM спросит: какой персонаж нужен, что считать доказательством, сколько раундов — потому что без этих данных правило обновления позиции не работает.
Почему это работает (механика)
Откуда берётся статичность. LLM генерирует текст, следуя паттернам из обучения. У него нет «живой переменной позиции», которая обновляется между сообщениями. Каждый ответ порождается из всего контекста разом — но без механизма, который отслеживает «что я думал в начале vs что узнал сейчас».
Почему инструкционные модели кооперативны. ChatGPT и Claude прошли RLHF — обучение на предпочтениях людей, которые оценивали ответы. Люди ставили высокие оценки полезным, согласным, неконфликтным ответам. Это и есть кооперативный prior: модель статистически тянется к согласию.
Почему температура не даёт разнообразия. Температура — это параметр случайности при выборе следующего слова. Она размазывает один и тот же ответ вокруг одного и того же смысла. Это как попросить одного человека высказаться 10 раз подряд разными словами — вы получите вариации, не разные точки зрения. Для настоящего разнообразия нужны разные персонажи с разной логикой.
Ограничения
⚠️ Явное обновление — не серебряная пуля: Даже с прописанным правилом модель иногда обновляет позицию на словах, но не меняет реальную логику ответа. Работает лучше для структурированных задач (анализ, критика), хуже для открытых творческих.
⚠️ Обратная индукция имеет предел: Запрос «рассуждай от конца к началу» работает для 3-5 шагов. На горизонте 10+ шагов модель теряет нить и начинает заполнять шаги формально.
⚠️ Исследование на открытых моделях Qwen: Результаты получены на локальных открытых моделях (Qwen 2.5), не на GPT-4 или Claude. Принципы, вероятно, переносятся — статичность и кооперативный prior подтверждены другими исследованиями — но точные пороги могут отличаться.
⚠️ Ни одна конфигурация не воспроизвела человеческое распределение: Расстояние между поведением моделей и людьми оставалось 0.40-0.52 при любых настройках. Это значит: LLM как симулятор человека — принципиально ограничен вне зависимости от настроек.
Как исследовали
Идея была простой: взять классические игры из поведенческой экономики — где учёные десятилетиями знают как ведут себя люди — и посмотреть, насколько LLM воспроизводит те же паттерны. Команда выбрала два полюса: p-beauty contest (угадай 2/3 от среднего — тест глубины рассуждения) и игру общественных благ (вкладывай или бери — тест кооперации). Прогнали 360 комбинаций настроек через одну модельную семью — Qwen 2.5 от 0.5 до 32 миллиардов параметров — меняя температуру, квантизацию, тип модели и фрейм подачи.
Самое интересное началось на шаге проверки гипотез. Исследователи ожидали, что какая-нибудь комбинация настроек воспроизведёт человеческое распределение. Этого не случилось — ни разу. Люди в этих играх разнообразны: часть думает поверхностно, часть глубже, кто-то кооперирует, кто-то считает стратегически. Модели же всегда кластеризовались вокруг одной точки — просто эта точка смещалась в зависимости от настроек. Человеческое разнообразие, по сути, неиммитируемо через один экземпляр модели с разными параметрами.
Фокусный тест — на статичность — оказался самым чистым. Люди в повторяющейся игре постепенно снижают кооперацию (узнают, что другие жульничают) и дефектируют в последнем раунде (знают, что дальше игры нет). LLM делал ни то, ни другое: вклады не снижались, и на «последнем раунде» поведение не менялось. Зато на тип горизонта — конечная vs бесконечная игра — модели реагировали. Это и есть категориальное мышление в действии: реакция на ярлык ситуации, не на её конкретику.
Адаптации и экстраполяции
🔧 Техника: Гетерогенный ансамбль вместо одного запроса
Исследование показало: единственный способ получить настоящее разнообразие — это настоящая гетерогенность агентов. В чате это переводится просто: несколько запросов с явно разными персонажами, потом синтез.
🔧 Три запроса вместо одного + синтез → настоящее распределение мнений
Запрос 1: Ты — Антон, 25 лет, продакт из Яндекса. Смотришь на вещи через метрики и скорость. Оцени {идею}. Что убедит, что не убедит. Запрос 2: Ты — Светлана, 45 лет, директор по маркетингу FMCG. Смотришь через потребителя и бренд. Оцени {идею}. Что убедит, что не убедит. Запрос 3: Ты — Рашид, партнёр инвестфонда. Смотришь через unit-экономику и выход. Оцени {идею}. Что убедит, что не убедит. Финальный запрос: Вот три оценки [вставить]. В чём они сошлись? В чём разошлись и почему? Какую точку зрения труднее всего опровергнуть?Три разных персонажа с разной логикой дадут реально разные веса аргументам. Потом синтез покажет, где есть консенсус, а где — реальный конфликт позиций.
🔧 Техника: Явный «детектор смещения» для инструкционных моделей
Зная, что ChatGPT/Claude имеют кооперативный prior — можно его предсказать и откалибровать.
🔧 Добавь в финал любого аналитического промпта:
После ответа добавь блок: [Проверка смещения] — Я соглашался с тобой чаще, чем оспаривал? (да/нет) — Если да: какой мой аргумент был самым слабым? — Есть ли позиция, которую я НЕ смог бы сломить реальными данными?Это превращает кооперативный prior из проблемы в ресурс: модель сама диагностирует, где была чрезмерно мягкой.
Ресурсы
Работа: LLM Agents as Static Level-k Players in Behavioural Games: Design choices, distributional fidelity, and the reproduction of human strategic play (Working draft, June 2026)
Автор: Po Han Teo, Independent Researcher, Singapore — aaronteopohan@hotmail.com
Ключевые отсылки из работы: - Level-k theory: Nagel (1995), Camerer, Ho & Chong (2004) - Public goods human baseline: Herrmann, Thoeni & Gachter (2008) - P-beauty contest human data: Bosch-Domenech et al. (2002) - LLM as synthetic subjects: Argyle (2023), Horton (2023), Mei et al. (2024) - Ближайшая похожая работа: Affonso (2026), Alekseenko et al. (2025)
