3,583 papers
arXiv:2606.22349 81 21 июня 2026 г. FREE

CURIOBOT: пять операторов любопытства — как заставить LLM учить, а не объяснять

КЛЮЧЕВАЯ СУТЬ
Парадокс: чем полнее LLM объясняет — тем хуже учит. Идеальный ответ закрывает зазор между «думаю что знаю» и «как оно есть» — и мозг переключается. Диалог умирает через 5 реплик, потому что информация без напряжения не требует ответного действия. CURIOBOT позволяет превратить LLM в наставника, который намеренно не закрывает вопрос — а удерживает напряжение, пока ученик не разберётся сам. Пять операторов (противоречие, новизна, сложность, неопределённость, нейтральный) меняют не содержание ответа, а угол подачи — через противоречие, неожиданную аналогию или нерешённый вопрос. Никакого дообучения, чистый промпт. Результат: в 2.4 раза больше ходов в диалоге — ученик сам не хочет останавливаться.
Адаптировать под запрос

TL;DR

CURIOBOT — набор из пяти операторов, которые меняют не что говорит LLM, а как она подаёт информацию: через противоречие, новизну, сложность, неопределённость или нейтрально. Оператор выбирается по состоянию диалога и создаёт эпистемическое напряжение — зазор между тем, что ученик думает, что знает, и тем, что оказывается на самом деле. Вся механика реализуется через промптинг, без дообучения модели.

Обычная LLM в роли наставника по умолчанию выдаёт исчерпывающие объяснения — и это ловушка. Ученик читает, говорит «понял», и диалог умирает. Не потому что скучно, а потому что информация без напряжения не требует ответного действия. Мозг фиксирует факт и переключается. Стандартный сеанс: 4-7 реплик, потом тишина.

Операторы ломают этот паттерн. CONFLICT вводит противоречие в логику ученика — и ему надо это разрешить. UNCERTAINTY говорит «учёные до сих пор спорят» — и ученик сам начинает задавать вопросы. NOVELTY переформулирует через неожиданную аналогию — и ученик проверяет, работает ли она. В итоге: в 2.4 раза больше ходов в диалоге при том же времени.


🔬

Схема метода

Всё происходит в одном диалоге — не нужны отдельные запросы

ШАГ 1: Оцени состояние ученика
  └─ Короткие ответы / "понял, спасибо" → NOVELTY или CONFLICT (перезапустить)
  └─ Преждевременная уверенность → COMPLEXITY или UNCERTAINTY (расширить)
  └─ Активно задаёт вопросы → NEUTRAL (не мешать)

ШАГ 2: Сформируй ответ через выбранный оператор
  NOVELTY     → Неожиданная аналогия или угол зрения
  COMPLEXITY  → "А вот что ещё завязано на это..." — новые зависимости
  CONFLICT    → Противоречие внутри того, что ученик только что сказал
  UNCERTAINTY → Нерешённый вопрос в науке/практике по теме
  NEUTRAL     → Обычный ответ без манипуляции вниманием

ШАГ 3: Не фиксируй оператор — меняй по ситуации
  └─ Повтор одного оператора снижает эффект
  └─ Сильный переход: после UNCERTAINTY → CONFLICT

🚀

Пример применения

Задача: Ты продаёшь на Wildberries и хочешь разобраться, почему растёт выручка, но не прибыль. Садишься учиться юнит-экономике в диалоге с Claude.

Промпт:

Ты — наставник по юнит-экономике. Тема: юнит-экономика продаж на Wildberries.

Моя цель: понять, почему при росте выручки прибыль не растёт.

Правила работы:
— Не давай готовых ответов сразу. Сначала спроси, что я уже думаю.
— Следи за моими ответами. Если я даю короткое «понял» или соглашаюсь — 
  переключись: введи противоречие в мою логику или покажи неожиданный угол.
— Если я слишком уверен — усложни: покажи зависимости, которые я не учёл.
— Если я активно копаю — не мешай, отвечай нейтрально.
— Чередуй подходы: противоречие → новизна → неопределённость. 
  Не используй один приём два раза подряд.
— Никогда не завершай тему сам. Пусть я решу, когда хватит.

Начни с вопроса: что я сейчас думаю про связь выручки и прибыли на маркетплейсе?

Результат:

Модель начнёт не с объяснений, а с вопроса. После твоего ответа она, скорее всего, введёт противоречие: "Ты сказал, что нужно больше продавать — но вот что интересно: именно при росте продаж у большинства селлеров маржа падает. Как это?". Ты начнёшь копать. Через несколько ходов появится UNCERTAINTY: "Даже среди финансовых аналитиков нет консенсуса, на каком объёме юнит-экономика Wildberries становится рентабельной — потому что комиссии непрозрачны и меняются ретроспективно." Диалог будет продолжаться 15-20+ реплик вместо стандартных 5.


🧠

Почему это работает

LLM по умолчанию оптимизирует под "правильность" — даёт полный, точный, хорошо структурированный ответ. Это убивает любопытство. Когда пробел заполнен, стимула двигаться дальше нет. Модель ведёт себя как хорошая Википедия: исчерпывающая и мёртвая.

Любопытство — это реакция на напряжение, а не на информацию. Психолог Берлайн ещё в 1960-х описал: человек начинает активно исследовать, когда сталкивается с новизной, сложностью, противоречием или неопределённостью — то есть когда картина мира не сходится. CONFLICT-оператор показал лучший результат (79% успешных применений) именно потому, что создаёт самое острое напряжение: "ты только что сказал Х, но вот факт Y — как это сочетается?"

Операторы используют то, что LLM умеет хорошо — генерировать точно по инструкции. Если сказать "введи противоречие в логику ученика, не раскрывая решения" — модель сделает это точно. Оператор — это не магия, это точная инструкция по управлению информационным зазором. Ты задаёшь механику, модель выполняет.

Рычаги управления: - Не используй один приём два раза подряд → ключевой параметр. Повтор NOVELTY снижает эффект вдвое. Чередование держит напряжение. - Замени нейтральные глаголы на конкретные триггеры: "введи противоречие" работает сильнее чем "создай интерес". - Добавь условие не завершай тему сам → иначе модель будет "закрывать вопрос" в конце каждого ответа.


📋

Шаблон промпта

Ты — наставник по теме: {тема}.

Моя цель: {что хочу понять или научиться делать}.

Правила работы:
— Начинай каждую тему с вопроса о том, что я уже думаю — не объясняй сразу.
— Следи за моими ответами:
  • Короткий ответ / "ясно" / "понял" → переключись: 
    введи противоречие в мою логику ИЛИ покажи неожиданный угол зрения
  • Я уверен и не сомневаюсь → усложни: 
    покажи зависимости или механики, которые я не учёл
  • Я активно задаю вопросы и разбираю тему → отвечай нейтрально, не мешай
— Чередуй подходы по кругу: 
  противоречие → новизна → неопределённость → сложность
  Не применяй один подход два раза подряд.
— Никогда не "закрывай тему" в конце ответа. 
  Заканчивай открытым вопросом или нерешённым аспектом.

Начни: спроси, что я сейчас думаю про {тема}.

Что подставлять: - {тема} — конкретная, не широкая: "ценообразование в SaaS" вместо "бизнес" - {что хочу понять} — конкретная боль или вопрос, не "разобраться"


🚀 Быстрый старт — вставь в чат:

Вот шаблон CURIOBOT — метод обучения через управляемое любопытство. 
Адаптируй под мою задачу: {твоя тема и цель}.
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит тему и что именно ты хочешь понять — потому что без этого невозможно настроить правильные триггеры переключения между операторами. Она возьмёт паттерн из шаблона и выстроит сессию под твою задачу.


⚠️

Ограничения

⚠️ UNCERTAINTY работает хуже всего: Оператор неопределённости показал наименьший успех — всего 44%. Фраза "учёные ещё не знают" работает, только если ученик уже вовлечён. На старте скорее отталкивает — "зачем мне это, если даже эксперты не разобрались?"

⚠️ Повтор убивает эффект: Если модель снова и снова использует одну технику — ученик засыпает. Это надо контролировать явно в промпте. Без инструкции "чередуй" модель залипнет на NOVELTY — он самый частотный по умолчанию.

⚠️ Не для фактологических запросов: Если тебе нужен конкретный ответ — "какой курс доллара", "напиши письмо" — режим CURIOBOT замедляет и раздражает. Это инструмент для обучения, не для поиска.

⚠️ Gemini ведёт себя иначе: У одной из протестированных моделей качество объяснений падало при включении операторов — любопытство росло, но точность снижалась. Если заметишь, что ответы стали менее точными — добавь в промпт: Качество объяснений не должно страдать — только меняй подачу, не содержание.


🔍

Как исследовали

Команда из Singapore Management University и Carnegie Mellon провела контролируемый эксперимент 3×3×3: три семейства моделей (Claude, Gemini, GPT), три домена (STEM, социальные науки, гуманитарные), три уровня сложности тем. 45 участников провели в общей сложности 270 сеансов по 10-30 минут каждый — в зависимости от сложности темы.

Интересная деталь дизайна: участники не знали, с какой версией тьютора работают. Каждый провёл сессии со всеми тремя вариантами (базовая модель, CURIOBOT, нативный режим обучения от провайдера), но на разных темах — чтобы не было эффекта переноса. В итоге исследователи могли честно сравнивать на одной аудитории.

Оценка шла по 10 измерениям через LLM-судью — три разных модели, три независимых прогона каждая — итого 9 оценок на один диалог. Это нетривиальная методология: обычно исследования используют одного судью, здесь намеренно агрегировали, чтобы убрать систематическую предвзятость конкретной модели.

Самая неожиданная находка: улучшение со стороны ученика сохранялось даже когда качество объяснений тьютора падало. Это значит, что любопытство работает как частично независимый механизм — не "объяснили лучше, поэтому больше вопросов", а "правильно создали напряжение — и человек сам начал копать". CONFLICT при этом оказался эффективнее NOVELTY: 79% против 61% — хотя интуитивно кажется, что показать что-то новое проще, чем ввести противоречие.


📄

Оригинал из исследования

NOVELTY — пример оператора (тема: Rule of Thirds в фотографии):
"Imagine the frame as a quietly haunted chessboard where the most powerful 
square is almost never the center — that strange bias is the doorway..."

CONFLICT — пример оператора (та же тема):
"...common sense screams that the most important subject must sit dead center 
to command absolute attention. Yet... centering an object actually paralyzes 
the viewer's gaze, creating a stagnant visual trap..."

UNCERTAINTY — пример оператора (тема: теория игр в международных отношениях):
"...here's what even top scholars fiercely debate... whether game theory 
explains international relations or merely provides elegant metaphors... 
remains one of the deepest unresolved questions in the field... 
Parting Mystery: if two nations are both using game theory to model each other, 
does the model become a self-fulfilling prophecy that creates the very behavior 
it claims to predict?"

COMPLEXITY — пример оператора (тема: Эффект Мпемба):
"...pulling us into the hidden thermodynamic complexities... However, these 
classical mechanics still fall short of explaining why perfectly sealed 
containers, where absolutely no evaporated mass can escape, continue to 
demonstrate this astonishing thermodynamic paradox."

Контекст: Исследователи показывали одну и ту же тему через разные операторы, чтобы наглядно продемонстрировать — меняется только фрейм, не содержание.


💡

Адаптации и экстраполяции

1. Адаптация: использовать операторы для разогрева перед сложным запросом

Прежде чем попросить LLM решить задачу, пройди быстрый CONFLICT-раунд по теме.

💡 Адаптация для подготовки к переговорам:

Я готовлюсь к переговорам с поставщиком по снижению цены на 15%.
Я думаю, что главный аргумент — объём закупки.

Введи противоречие: почему объём может НЕ работать как аргумент в данном случае?
Не раскрывай решение — только создай напряжение, чтобы я сам нашёл лучший ход.

2. Адаптация: режим CONFLICT для стресс-теста идеи

🔧 Техника: попросить CONFLICT-оператор напрямую → острая критика без общих фраз

Вместо "покритикуй мою идею" (модель выдаст дипломатичный список) — попроси ввести конкретное противоречие:

Вот моя идея: {опиши идею}.
Я уверен, что {твоё ключевое допущение}.

Введи противоречие прямо в это допущение: покажи реальный случай или механику, 
где это убеждение приводит к провалу. Не давай решения — только обнажи разрыв.

Это работает острее, чем просьба "найди слабые места" — потому что CONFLICT бьёт в конкретную точку уверенности, а не сканирует всё подряд.


3. Экстраполяция: 10-мерный фрейм для оценки своей LLM-сессии

Исследование предлагает 4 метрики со стороны ученика, которые можно использовать как чеклист после сессии обучения:

После сессии обучения оцени её по 4 вопросам:

1. Я задавал вопросы, которые не планировал? (Исследовательские вопросы)
2. Я пересматривал свою точку зрения в процессе? (Продуктивная борьба)
3. Мне хотелось копать глубже, чем требует задача? (Видимое любопытство)
4. Я сам направлял диалог — менял тему, добавлял примеры? (Агентность)

Если по всем 4 ответ "нет" — сессия была пассивной. 
Попроси LLM перезапустить тему, начав с оператора CONFLICT.

🔗

Ресурсы

Название работы: Curiosity as Linguistic Intervention: Using LLM Tutoring Dialogues to Influence Exploratory Learning Behavior

Авторы: Gevindu Ganganath, Pasindu Bolonghege, Qianru Lyu, Pradeep Varakantham, Thivya Kandappu

Организации: School of Computing and Information Systems, Singapore Management University; Human-Computer Interaction Institute, Carnegie Mellon University

Теоретическая основа: Теория коллативных переменных Берлайна (Berlyne, 1960, 1962) — базовая психологическая теория, на которой построены операторы


📋 Дайджест исследования

Ключевая суть

Парадокс: чем полнее LLM объясняет — тем хуже учит. Идеальный ответ закрывает зазор между «думаю что знаю» и «как оно есть» — и мозг переключается. Диалог умирает через 5 реплик, потому что информация без напряжения не требует ответного действия. CURIOBOT позволяет превратить LLM в наставника, который намеренно не закрывает вопрос — а удерживает напряжение, пока ученик не разберётся сам. Пять операторов (противоречие, новизна, сложность, неопределённость, нейтральный) меняют не содержание ответа, а угол подачи — через противоречие, неожиданную аналогию или нерешённый вопрос. Никакого дообучения, чистый промпт. Результат: в 2.4 раза больше ходов в диалоге — ученик сам не хочет останавливаться.

Принцип работы

Стандартный LLM-наставник работает как хорошая Википедия. Нашёл ответ — закрыл вкладку. Операторы CURIOBOT работают иначе: каждый ответ не заполняет пробел, а создаёт новый. Самый сильный оператор — CONFLICT. Он не говорит «вот как правильно» — он говорит «ты только что сказал X, а вот факт Y — как это сочетается?». Это задевает не незнание, а уверенность. Острее всего. Ключевой параметр — чередование: один оператор два раза подряд снижает эффект вдвое. Без явной инструкции «не повторяй» модель залипнет на NOVELTY — он самый частотный по умолчанию. Прокладывай маршрут: противоречие → новизна → неопределённость.

Почему работает

Психолог Берлайн ещё в 1960-х показал: любопытство — реакция на напряжение, а не на информацию. Человек начинает активно исследовать когда его картина мира не сходится. Данные CURIOBOT подтверждают это точными числами. CONFLICT — лучший оператор с результатом 79%. UNCERTAINTY — худший: всего 44%. Разница понятна: противоречие задевает уже сложившееся убеждение — это острее. Неопределённость («учёные ещё спорят») работает только если ученик уже вовлечён. На старте скорее отталкивает — зачем копать тему, в которой даже эксперты не разобрались.

Когда применять

Обучение любому предмету — история, программирование, экономика, право — особенно когда нужно не запомнить факт, а понять логику и причинно-следственные связи. Идеально для ситуаций где у тебя есть «наивная теория» — кажется что знаешь, но картина неполная. НЕ подходит для фактологических запросов («какой курс доллара», «напиши письмо», «переведи текст») — там операторы замедляют и раздражают. CURIOBOT — инструмент для обучения, не для поиска.

Мини-рецепт

1. Задай тему конкретно: не «бизнес», а «ценообразование в подписочных сервисах». Чем уже — тем точнее операторы попадают в твою логику.
2. Сформулируй конкретную боль: не «хочу разобраться», а «почему при росте выручки прибыль не растёт». Это даёт модели точку для противоречия.
3. Запрети давать ответ сразу: добавь — «начни с вопроса, что я уже думаю — не объясняй сразу». Иначе модель всё равно выдаст Википедию.
4. Пропиши триггеры переключения явно: короткий ответ или «понял» → введи противоречие в мою логику; я уверен и не сомневаюсь → покажи зависимости которые я не учёл; активно разбираю → отвечай нейтрально.
5. Запрети повтор: «не применяй один подход два раза подряд» — это критично. Без этого пункта эффект падает вдвое.
6. Запрети закрывать тему: «никогда не заканчивай ответ точкой — только открытым вопросом или нерешённым аспектом». Без этого модель будет подводить итог в конце каждой реплики.

Примеры

[ПЛОХО] : Объясни юнит-экономику для продавца на маркетплейсе
[ХОРОШО] : Ты — наставник по теме: юнит-экономика на Wildberries. Моя цель: понять почему при росте выручки прибыль падает. Начни с вопроса — что я думаю про это прямо сейчас. Если я отвечу коротко или скажу «понял» — введи противоречие в мою логику, не раскрывая ответа. Если я уверен и не сомневаюсь — покажи зависимости которые я не учёл. Никогда не закрывай тему сам. Чередуй подходы: противоречие → новизна → неопределённость. Не повторяй один подход дважды подряд.
Источник: Curiosity as Linguistic Intervention: Using LLM Tutoring Dialogues to Influence Exploratory Learning Behavior
ArXiv ID: 2606.22349 | Сгенерировано: 2026-06-28 20:50

Проблемы LLM

ПроблемаСутьКак обойти
Полный ответ убивает диалогПросишь объяснить тему. Модель даёт исчерпывающий ответ. Пробел закрыт — стимула продолжать нет. Говоришь «понял, спасибо» и уходишь. Диалог умирает за 4–7 реплик. Проблема не в скуке. Проблема в том, что полный ответ не требует ответного действияЗапрети модели закрывать тему. Добавь в запрос: не завершай тему сам — заканчивай открытым вопросом или нерешённым аспектом. Модель начнёт создавать зазор вместо того чтобы его заполнять

Методы

МетодСуть
Операторы напряжения — управляемое незнаниеВместо «объясни тему» пиши инструкцию с четырьмя реакциями на состояние собеседника. Короткий ответ / «понял» модель вводит противоречие в только что сказанное ИЛИ показывает неожиданный угол. Преждевременная уверенность модель добавляет зависимости и механики, которые собеседник не учёл. Активно копает сам модель отвечает нейтрально, не мешает. Ключевое правило: не применяй один приём два раза подряд — чередуй по кругу. Почему работает: противоречие, новизна и сложность создают зазор между тем что человек думает и тем что есть. Зазор требует действия. Без зазора — нет движения. Не работает для фактологических запросов: «напиши письмо», «переведи текст»

Тезисы

ТезисКомментарий
Противоречие в логике собеседника — самый сильный крючокИз четырёх приёмов противоречие работает лучше всех. Механика: человек только что сказал X. Модель показывает факт Y который с X не сочетается. Возникает когнитивный дискомфорт — его надо разрешить. Неопределённость («учёные ещё спорят») работает хуже всего: не вовлечённого человека такая фраза скорее отталкивает. Применяй: начинай сессию с противоречия, неопределённость оставь для момента когда человек уже вовлечён
📖 Простыми словами

Curiosity as Linguistic Intervention:UsingLLMTutoring Dialogues to Influence Exploratory Learning Behavior

arXiv: 2606.22349

Суть в том, что обычные нейронки слишком стараются быть полезными и вываливают на тебя готовые ответы, как прилежные отличники. Это убивает обучение на корню: когда тебе сразу разжевали и положили в рот, мозг засыпает. Исследователи придумали CURIOBOT — систему из пяти операторов, которые искусственно создают эпистемическое напряжение. Вместо того чтобы просто выдать базу, модель начинает играть с твоим восприятием через противоречие, новизну или неопределенность. Она специально оставляет зазоры в знаниях, чтобы ты сам захотел их заполнить, превращая скучную лекцию в детективное расследование.

Это как если бы ты пришел к опытному наставнику, а он вместо прямой инструкции начал задавать каверзные вопросы. Формально он мог бы просто сказать, что делать, но тогда ты ничему не научишься. Вместо этого он указывает на дыру в твоей логике или подбрасывает факт, который ломает твою привычную картину мира. Ты чувствуешь легкий зуд — информационный голод, который заставляет тебя копать глубже. Это превращает пассивное потребление контента в активную охоту за истиной, где драйвером выступает твое собственное любопытство, а не команда "учись".

Внутри этой механики работают конкретные лингвистические рычаги, которые можно внедрить через обычный промптинг. Например, оператор противоречия сталкивает твои убеждения с реальностью, а оператор сложности подсвечивает нюансы, о которых ты даже не задумывался. Если ты разбираешься с юнит-экономикой на маркетплейсах, модель не просто скажет: "У тебя высокие налоги". Она укажет на то, что при росте выручки твоя маржа падает, и спросит: "Как думаешь, почему масштаб тебя убивает, а не спасает?". Это заставляет мозг включиться на полную мощность, потому что неопределенность бесит, и ты хочешь от нее избавиться.

Хотя метод тестировали на обучении, этот принцип — золотая жила для любого контента. Его можно адаптировать для маркетинга, рассылок или сценариев видео. Вместо того чтобы кормить пользователя сухими фактами, нужно создавать интеллектуальный дефицит. Если ты продаешь сложный продукт, не объясняй его пользу в лоб — подсвети проблему так, чтобы человек сам пришел к выводу, что ему нужно решение. SEO-тексты для роботов окончательно уходят в прошлое, уступая место диалоговым интерфейсам, где побеждает тот, кто умеет удерживать внимание через вовлечение и интригу.

Короче, хватит использовать AI как справочник, который выдает стерильные ответы. Будущее за моделями, которые умеют быть неудобными собеседниками. Если ты хочешь, чтобы человек (или ты сам) реально что-то усвоил, нужно перестать закрывать все вопросы и начать их правильно задавать. CURIOBOT доказывает: чтобы научить, нужно не давать информацию, а создавать условия, в которых ее невозможно не искать. Кто научится проектировать это напряжение в диалоге, тот получит самую вовлеченную аудиторию, пока остальные продолжают плодить мертвые тексты из Википедии.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с