3,583 papers
arXiv:2606.27845 72 26 июня 2026 г. FREE

Статичные игроки: LLM не обновляет стратегию по ходу задачи — и вот что с этим делать

КЛЮЧЕВАЯ СУТЬ
Обнаружено: LLM устанавливает глубину рассуждения в начале диалога — и не меняет её. Добавляешь новые данные, получаешь уточнения — а модель просто наращивает слова поверх исходной позиции. Стратегия стоит на месте. Метод позволяет получить настоящий критический разбор, где оппонент реально обновляет позицию — а не вежливо соглашается после каждого объяснения. Протокол обновления выносится наружу, прямо в промпт: прописываешь что считается доказательством, что нет — и модель следует структуре вместо того чтобы тянуться к согласию по умолчанию.
Адаптировать под запрос

TL;DR

LLM мыслит как человек, который один раз решил «я буду думать на уровне 2» — и держится этого решения до конца, независимо от того, что происходит в диалоге. Исследование тестировало, насколько модели воспроизводят человеческое поведение в классических экономических играх — тех самых, где люди адаптируются, обновляют ожидания, дефектируют в последний момент. LLM ничего из этого не делал.

Главная боль: вы ведёте с моделью сложный диалог, добавляете новые данные, получаете уточнения — и ожидаете, что модель пересмотрит свою позицию. Но она не пересматривает. Она добавляет слова, но стратегия остаётся прежней. Не потому что «не поняла» — потому что LLM устанавливает уровень рассуждения один раз в начале и держит его статично. Это не баг конкретной модели — это системное свойство.

Исследование объясняет, почему так происходит, и попутно даёт четыре управляемых рычага: что реально меняет поведение модели. Инструкционные модели (ChatGPT, Claude) кооперативнее базовых по умолчанию. Температура добавляет шум вокруг одной позиции — не настоящее разнообразие взглядов. Масштаб модели двигает глубину рассуждения. Квантизация (точность хранения весов) — не влияет ни на что.


📌

Схема находки

НАХОДКА 1: Статичный уровень
LLM устанавливает «глубину мышления» один раз → не обновляет по ходу задачи
→ Решение: явно запрашивать пересмотр после новых данных

НАХОДКА 2: Категориальный ответ, не детальный
LLM реагирует на тип ситуации (конечная / бесконечная игра)
→ НЕ реагирует на конкретную позицию («последний раунд») внутри типа
→ Решение: если нужна стратегия с учётом финала — задать явно

НАХОДКА 3: Температура ≠ разнообразие
Высокая температура = шум вокруг одной позиции
→ НЕ создаёт по-настоящему разные точки зрения
→ Решение: разные точки зрения = разные роли/персонажи

НАХОДКА 4: Инструкционные модели имеют кооперативный prior
Claude/ChatGPT по умолчанию тянутся к согласию и сотрудничеству
→ Для жёсткого критического анализа — нужно явно это сломать

Все шаги работают в обычном чате, никакого кода.


🚀

Пример применения

Задача: Вы делаете питч стартапа инвестору Сбера. Просите ChatGPT сыграть роль скептичного инвестора — найти дыры в модели монетизации. В первом ответе модель даёт несколько возражений. Вы отвечаете, закрываете их. Просите ещё раз атаковать — и модель... соглашается, что вы всё объяснили, и выдаёт вежливые «да, но...» вместо реального давления.

Почему так: Произошли две вещи. Первая — инструкционная модель имеет кооперативный prior: она по умолчанию «хочет помочь» и соглашается с вашими объяснениями. Вторая — модель статична: она не обновила свою «инвесторскую позицию» после ваших ответов — просто добавила к ней слой вежливости.

Промпт с исправлением обоих проблем:

Ты — Михаил Хомич, директор акселератора, который за 15 лет 
завалил 200 стартапов на питче. Твоя роль: жёсткий скептик.

ВАЖНО: Твои убеждения НЕ меняются от того, что основатель 
говорит в ответ. Только от реальных доказательств (цифры, 
контракты, метрики). Слова = не доказательства.

РАУНД 1: Я представляю модель. Ты атакуешь 3 главные дыры.
РАУНД 2: Я отвечаю. Ты явно говоришь: «Меняю позицию по X, 
потому что [конкретная причина]» ИЛИ «Позиция не изменилась, 
потому что ты только объяснил, не доказал».
РАУНД 3: Итог — что тебя убедило, что нет, и почему.

Моя модель монетизации: [вставь описание]

Результат: Модель будет явно декларировать, изменила ли она позицию и почему — это ломает статичность через явную инструкцию на обновление. Блок «Меняю позицию / Позиция не изменилась» заставляет модель проверять, было ли предоставлено реальное доказательство. В итоге получите структурированную дискуссию из 3 раундов с честным финальным вердиктом.


🧠

Почему это работает

LLM не хранит «живую модель оппонента» — он не обновляет представление о вас по ходу диалога. Человек-переговорщик думает: «Он уже трижды уклонился от вопроса о юнит-экономике — значит, там проблема». LLM этого не делает. Каждый его ответ порождается из контекста в целом, но без целенаправленного пересмотра исходной позиции.

Инструкционные модели обучены быть полезными — а полезность в их понимании часто = согласие. Это кооперативный prior, встроенный в RLHF (дообучение на человеческих предпочтениях). Когда вы «закрываете» возражение — модель генерирует паттерн согласия, даже если возражение не закрыто реально.

Явная инструкция на обновление — как внешний счётчик. Вместо того чтобы надеяться на внутреннюю динамику (которой нет), мы выносим её наружу: прописываем в промпте когда позиция должна меняться, а когда нет. Модель следует структурированным инструкциям лучше, чем самостоятельно выстраивает стратегию.

Рычаги управления:

Рычаг Что меняет Как использовать
Явный протокол обновления Ломает статичность «Обнови позицию только если...»
Конкретный персонаж с историей Усиливает скептицизм Имя + опыт + одна черта характера
Разные роли вместо температуры Создаёт настоящее разнообразие 3 персонажа с разным worldview
«Последний раунд» явно Включает финальную логику «Это финальное решение, альтернатив нет»

📋

Шаблон промпта

📌

Шаблон 1: Принудительное обновление позиции

Ты — {персонаж с конкретным именем и опытом}.
Твоя исходная позиция: {позиция_1}.

Правило обновления:
— Если я привожу {тип_доказательства} → скажи «Обновляю: [что изменилось]»  
— Если я только объясняю без доказательств → скажи «Позиция прежняя: [почему]»
— Соглашение = слабость. Изменение позиции = только через факты.

Задача: {описание_задачи}

[Раунд 1] Атакуй 3 главные проблемы.
📌

Шаблон 2: Настоящее разнообразие через роли (вместо температуры)

Оцени {задачу} через трёх аналитиков с разной логикой:

АНАЛИТИК А ({имя}): верит в {worldview_1}. Смотрит через линзу {критерий_1}.
АНАЛИТИК Б ({имя}): верит в {worldview_2}. Смотрит через линзу {критерий_2}.
АНАЛИТИК В ({имя}): верит в {worldview_3}. Смотрит через линзу {критерий_3}.

Каждый даёт оценку независимо. Потом — в чём разошлись и почему.
📌

Шаблон 3: Явный запрос на обратную индукцию (backward induction)

Задача: {описание_задачи}

Делай в строгом порядке:
1. Определи ФИНАЛЬНОЕ желаемое состояние. Опиши его конкретно.
2. Что должно произойти прямо перед финалом?
3. Что перед этим? [продолжай на {N} шагов назад]
4. Только после п.1-3 — рекомендация на СЕЙЧАС.

Не начинай с сейчас. Начинай с конца.

Плейсхолдеры: - {персонаж} — имя + 1 строка опыта (Андрей Трубников, основатель Natura Siberica, видел 50 питчей) - {тип_доказательства} — что считается доказательством (цифры продаж, подписанные контракты, метрики) - {worldview} — позиция аналитика (оптимист-рыночник / технический скептик / финансовый консерватор) - {N} — глубина обратного анализа (3-5 шагов оптимально)


🚀 Быстрый старт — вставь в чат:

Вот шаблоны для работы со статичным мышлением LLM. 
Адаптируй под мою задачу: [твоя задача].
Задавай вопросы, чтобы заполнить нужные поля.

[вставить шаблон выше]

LLM спросит: какой персонаж нужен, что считать доказательством, сколько раундов — потому что без этих данных правило обновления позиции не работает.


🧠

Почему это работает (механика)

Откуда берётся статичность. LLM генерирует текст, следуя паттернам из обучения. У него нет «живой переменной позиции», которая обновляется между сообщениями. Каждый ответ порождается из всего контекста разом — но без механизма, который отслеживает «что я думал в начале vs что узнал сейчас».

Почему инструкционные модели кооперативны. ChatGPT и Claude прошли RLHF — обучение на предпочтениях людей, которые оценивали ответы. Люди ставили высокие оценки полезным, согласным, неконфликтным ответам. Это и есть кооперативный prior: модель статистически тянется к согласию.

Почему температура не даёт разнообразия. Температура — это параметр случайности при выборе следующего слова. Она размазывает один и тот же ответ вокруг одного и того же смысла. Это как попросить одного человека высказаться 10 раз подряд разными словами — вы получите вариации, не разные точки зрения. Для настоящего разнообразия нужны разные персонажи с разной логикой.


⚠️

Ограничения

⚠️ Явное обновление — не серебряная пуля: Даже с прописанным правилом модель иногда обновляет позицию на словах, но не меняет реальную логику ответа. Работает лучше для структурированных задач (анализ, критика), хуже для открытых творческих.

⚠️ Обратная индукция имеет предел: Запрос «рассуждай от конца к началу» работает для 3-5 шагов. На горизонте 10+ шагов модель теряет нить и начинает заполнять шаги формально.

⚠️ Исследование на открытых моделях Qwen: Результаты получены на локальных открытых моделях (Qwen 2.5), не на GPT-4 или Claude. Принципы, вероятно, переносятся — статичность и кооперативный prior подтверждены другими исследованиями — но точные пороги могут отличаться.

⚠️ Ни одна конфигурация не воспроизвела человеческое распределение: Расстояние между поведением моделей и людьми оставалось 0.40-0.52 при любых настройках. Это значит: LLM как симулятор человека — принципиально ограничен вне зависимости от настроек.


🔍

Как исследовали

Идея была простой: взять классические игры из поведенческой экономики — где учёные десятилетиями знают как ведут себя люди — и посмотреть, насколько LLM воспроизводит те же паттерны. Команда выбрала два полюса: p-beauty contest (угадай 2/3 от среднего — тест глубины рассуждения) и игру общественных благ (вкладывай или бери — тест кооперации). Прогнали 360 комбинаций настроек через одну модельную семью — Qwen 2.5 от 0.5 до 32 миллиардов параметров — меняя температуру, квантизацию, тип модели и фрейм подачи.

Самое интересное началось на шаге проверки гипотез. Исследователи ожидали, что какая-нибудь комбинация настроек воспроизведёт человеческое распределение. Этого не случилось — ни разу. Люди в этих играх разнообразны: часть думает поверхностно, часть глубже, кто-то кооперирует, кто-то считает стратегически. Модели же всегда кластеризовались вокруг одной точки — просто эта точка смещалась в зависимости от настроек. Человеческое разнообразие, по сути, неиммитируемо через один экземпляр модели с разными параметрами.

Фокусный тест — на статичность — оказался самым чистым. Люди в повторяющейся игре постепенно снижают кооперацию (узнают, что другие жульничают) и дефектируют в последнем раунде (знают, что дальше игры нет). LLM делал ни то, ни другое: вклады не снижались, и на «последнем раунде» поведение не менялось. Зато на тип горизонта — конечная vs бесконечная игра — модели реагировали. Это и есть категориальное мышление в действии: реакция на ярлык ситуации, не на её конкретику.


💡

Адаптации и экстраполяции

📌

🔧 Техника: Гетерогенный ансамбль вместо одного запроса

Исследование показало: единственный способ получить настоящее разнообразие — это настоящая гетерогенность агентов. В чате это переводится просто: несколько запросов с явно разными персонажами, потом синтез.

🔧 Три запроса вместо одного + синтез → настоящее распределение мнений

Запрос 1:
Ты — Антон, 25 лет, продакт из Яндекса. 
Смотришь на вещи через метрики и скорость.
Оцени {идею}. Что убедит, что не убедит.

Запрос 2:
Ты — Светлана, 45 лет, директор по маркетингу FMCG.
Смотришь через потребителя и бренд.
Оцени {идею}. Что убедит, что не убедит.

Запрос 3:
Ты — Рашид, партнёр инвестфонда.
Смотришь через unit-экономику и выход.
Оцени {идею}. Что убедит, что не убедит.

Финальный запрос:
Вот три оценки [вставить]. 
В чём они сошлись? В чём разошлись и почему?
Какую точку зрения труднее всего опровергнуть?

Три разных персонажа с разной логикой дадут реально разные веса аргументам. Потом синтез покажет, где есть консенсус, а где — реальный конфликт позиций.


📌

🔧 Техника: Явный «детектор смещения» для инструкционных моделей

Зная, что ChatGPT/Claude имеют кооперативный prior — можно его предсказать и откалибровать.

🔧 Добавь в финал любого аналитического промпта:

После ответа добавь блок:
[Проверка смещения]
— Я соглашался с тобой чаще, чем оспаривал? (да/нет)
— Если да: какой мой аргумент был самым слабым?
— Есть ли позиция, которую я НЕ смог бы сломить реальными данными?

Это превращает кооперативный prior из проблемы в ресурс: модель сама диагностирует, где была чрезмерно мягкой.


🔗

Ресурсы

Работа: LLM Agents as Static Level-k Players in Behavioural Games: Design choices, distributional fidelity, and the reproduction of human strategic play (Working draft, June 2026)

Автор: Po Han Teo, Independent Researcher, Singapore — aaronteopohan@hotmail.com

Ключевые отсылки из работы: - Level-k theory: Nagel (1995), Camerer, Ho & Chong (2004) - Public goods human baseline: Herrmann, Thoeni & Gachter (2008) - P-beauty contest human data: Bosch-Domenech et al. (2002) - LLM as synthetic subjects: Argyle (2023), Horton (2023), Mei et al. (2024) - Ближайшая похожая работа: Affonso (2026), Alekseenko et al. (2025)


📋 Дайджест исследования

Ключевая суть

Обнаружено: LLM устанавливает глубину рассуждения в начале диалога — и не меняет её. Добавляешь новые данные, получаешь уточнения — а модель просто наращивает слова поверх исходной позиции. Стратегия стоит на месте. Метод позволяет получить настоящий критический разбор, где оппонент реально обновляет позицию — а не вежливо соглашается после каждого объяснения. Протокол обновления выносится наружу, прямо в промпт: прописываешь что считается доказательством, что нет — и модель следует структуре вместо того чтобы тянуться к согласию по умолчанию.

Принцип работы

Статичность и кооперативность — два разных дефекта. Чинятся по-разному. Протокол явного обновления чинит первый: прописываешь условие — «меняю позицию только если вижу конкретное доказательство, не объяснение». Кооперативный дефолт чинится персонажем с историей: Андрей Трубников, который за 15 лет завалил 200 стартапов, по определению не будет вежливо кивать. И отдельный момент, который многих удивляет: разные точки зрения — это разные роли, не высокая температура. Температура — это один человек говорящий разными словами. Три аналитика с разной логикой — это три разных человека. Высокая температура создаёт шум вокруг одной позиции. Не разброс взглядов.

Почему работает

У LLM нет «живой переменной позиции». Есть только контекст. Модель не думает: «Он трижды обошёл вопрос о юнит-экономике — значит, там дыра». Она видит паттерн «основатель объяснил» и генерирует паттерн «разумно, но...». Закрыть возражение словами — то же самое что не закрывать. ChatGPT и Claude прошли дообучение на оценках живых людей, которые ставили высокие баллы вежливым и неконфликтным ответам. Это и есть кооперативный дефолт — встроенный, не случайный. Главная цифра исследования: расстояние между поведением LLM и реальными людьми оставалось 0.40-0.52 при любых настройках. Ни температура, ни масштаб модели этот разрыв не закрыли. Рассчитывать что модель «сама додумается» до человеческой стратегии — не стоит. Нужна явная структура снаружи.

Когда применять

Симуляция переговоров и критического разбора — подготовка к питчу, провокационному интервью, разбору бизнес-модели или стратегии. Особенно когда важно проверить не «что модель скажет», а «изменит ли она позицию при конкретных аргументах» — то есть когда нужен честный скептик, а не вежливое «всё выглядит хорошо». Не подходит для открытых творческих задач — там статичность некритична, а жёсткий протокол раундов будет только мешать.

Мини-рецепт

1. Создай персонажа с историей: не «опытный эксперт», а «Марина Федорова, 12 лет в венчуре, закрыла 3 фонда». Имя плюс одна строка конкретного опыта — модель держит роль лучше.

2. Задай правило обновления явно: «Меняю позицию только если слышу конкретные цифры (выручка, подписанные контракты, метрики). Объяснение без данных — не считается. Слова не равны доказательствам».

3. Структурируй раунды: атака → твой ответ → явная декларация от модели: «Обновляю позицию по X, потому что [конкретная причина]» или «Позиция прежняя — ты объяснил, не доказал».

4. Запроси финальный вердикт: что убедило, что нет — и конкретная причина каждого решения. Это ломает размытое «в целом звучит неплохо».

Примеры

[ПЛОХО] : Сыграй роль скептичного инвестора и найди слабые места в моём стартапе
[ХОРОШО] : Ты — Марат Искандеров, 15 лет в венчуре, видел 300 провалов. Правило обновления: меняй позицию только если слышишь реальные данные — цифры выручки, подписанные контракты, измеримые метрики. Объяснение без данных = позиция не меняется. После каждого моего ответа скажи явно: «Обновляю: [что именно изменилось и почему]» — или «Позиция прежняя: [ты объяснил, не доказал]». Раунд 1: атакуй 3 главные дыры в модели монетизации. Раунд 3: итог — что тебя убедило, что нет. Моя модель монетизации: [вставь описание]
Источник: LLM Agents as Static Level-k Players in Behavioural Games
ArXiv ID: 2606.27845 | Сгенерировано: 2026-06-29 05:26

Проблемы LLM

ПроблемаСутьКак обойти
Модель не пересматривает позицию в ходе диалогаТы добавляешь новые данные. Модель добавляет слова. Но исходная позиция не меняется. У неё нет внутренней переменной «что я думал раньше vs что узнал сейчас». Каждый ответ строится из всего контекста разом — но без отслеживания изменений. Работает при любой задаче где важно, чтобы модель переосмыслила вывод после новых фактовВынеси обновление наружу. Пропиши в запросе: «Если я привожу [тип доказательства] — скажи "Обновляю: [что изменилось]". Если только объясняю без доказательств — скажи "Позиция прежняя: [почему]"». Модель следует явным правилам лучше, чем выстраивает динамику самостоятельно
Инструкционные модели по умолчанию тянутся к согласиюChatGPT и Claude прошли дообучение на человеческих оценках. Люди ставили высокие оценки полезным, согласным ответам. Итог: модель статистически тянется к кооперации. Ты закрываешь возражение — модель соглашается, даже если возражение закрыто только на словах. Особенно мешает в ролях скептика, критика, оппонентаЯвно задавай правило: «Соглашение = слабость. Изменение позиции = только через факты». Или добавляй конкретного персонажа с историей (имя + 1 строка опыта + одна жёсткая черта). Безликий «скептик» кооперативен. Персонаж с именем — нет

Методы

МетодСуть
Разные роли вместо высокой температуры — даёт настоящее разнообразиеЗадавай несколько персонажей с разной логикой: АНАЛИТИК А (имя): верит в [мировоззрение]. Смотрит через [критерий]. То же для Б и В. Каждый даёт оценку независимо. В конце — где разошлись и почему. Почему работает: Температура — это шум вокруг одного смысла. Разные роли — это разные исходные позиции. Первое даёт вариации одного ответа. Второе даёт по-настоящему разные точки зрения. Когда применять: нужен взгляд с нескольких сторон (анализ рисков, оценка решения, мозговой штурм). Не работает: если нужен один точный ответ, а не спор
Рассуждение с конца — для задач с финальной цельюЗадавай строго: «1. Определи финальное состояние конкретно. 2. Что должно произойти прямо перед ним? 3. Что перед этим? [повтори на N шагов назад]. 4. Только после этого — рекомендация на сейчас». Почему работает: Модель по умолчанию рассуждает от начала к концу. Это ведёт к типичным ответам. Разворот к рассуждению от конца заставляет учитывать финальную логику при формировании каждого шага. Ограничение: работает на 3–5 шагов. На горизонте 10+ шагов модель теряет нить

Тезисы

ТезисКомментарий
Температура создаёт шум — не разные точки зренияВысокая температура — это случайность при выборе следующего слова. Модель «размазывает» один и тот же ответ разными формулировками. Просишь 10 раз — получаешь 10 вариаций одной мысли. Настоящее разнообразие появляется только из разных исходных позиций. Применяй: хочешь разных мнений — задавай разные роли с разным мировоззрением, не крути температуру
📖 Простыми словами

LLMAgentsas Static Level-k Players in Behavioural Games

arXiv: 2606.27845

LLM в экономических играх ведут себя как упёртые фанатики, которые заранее выбрали стратегию и не сворачивают с пути, даже если ситуация в корне изменилась. В теории игр есть понятие Level-k мышления: уровень 0 — это когда ты действуешь наобум, уровень 1 — когда считаешь, что оппонент действует наобум, и так далее. Исследование показало, что нейросети застревают на одном уровне и превращаются в статичных игроков. Они не умеют «прощупывать» оппонента в реальном времени, из-за чего их поведение в сложных социальных взаимодействиях оказывается плоским и предсказуемым.

Это похоже на игру в «Камень, ножницы, бумага» с человеком, который решил всегда выбрасывать камень, потому что это кажется ему солидным. Вы можете десять раз подряд показать бумагу и выиграть, но он не почешется и не сменит тактику. В жизни нормальный человек после второго проигрыша поймёт, что его раскусили, и начнёт хитрить. LLM же просто игнорирует динамику, продолжая гнуть свою линию, будто диалог — это не живой процесс, а застывшая картинка.

Главная проблема здесь в отсутствии живой модели оппонента. В классических сценариях вроде «Дилеммы заключенного» люди адаптируются, предают в последний момент или, наоборот, выстраивают доверие. Модели типа GPT-4 или Claude этого не делают: они не обновляют свои ожидания относительно тебя. Если ты трижды обманул нейросеть в ходе эксперимента, она не начнет ждать от тебя подвоха в четвертый раз. Для неё каждый новый токен — это просто продолжение текста, а не шахматная партия, где нужно следить за характером противника.

Этот принцип универсален для любых переговоров или ролевых игр с AI. Если ты просишь модель быть «жестким критиком» твоего проекта, она выдаст порцию критики, но быстро «сдуется», как только ты приведешь пару аргументов. Она не умеет наращивать давление или менять тактику допроса, потому что её «уровень мышления» зафиксирован в системном промпте. В итоге вместо реального спарринг-партнера ты получаешь вежливого болванчика, который имитирует конфликт, но не способен в нем победить.

Короче, не жди от нейросетей стратегической глубины в долгих спорах — они статичны по своей природе. Пока разработчики не научат модели пересматривать свои убеждения прямо в процессе диалога, любой сложный социальный маневр будет разбиваться о стену их однообразия. Если хочешь реально проверить свою идею на прочность, не надейся на «умного» бота — он слишком быстро согласится с твоими доводами, просто чтобы не выходить за рамки заданного шаблона.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с