3,583 papers
arXiv:2606.16206 73 15 июня 2026 г. FREE

Тьюторский режим: как заставить LLM учить, а не решать за тебя

КЛЮЧЕВАЯ СУТЬ
Умеет решать — не значит умеет учить: у 8 AI-тьюторов корреляция между этими способностями всего 0.42, а разрыв в педагогических метриках между лучшим и худшим — 45 пунктов. Тьюторский режим позволяет переключить LLM с 'выдать ответ' на 'помочь додуматься самому' через явный запрет раскрывать решение. Добавь «не давай ответ напрямую — задавай минимум 2 наводящих вопроса» — и модель перестанет решать за тебя и начнёт задействовать педагогические паттерны. Без этой инструкции она всегда пойдёт по пути наименьшего сопротивления: выдаст ответ.
Адаптировать под запрос

TL;DR

Когда просишь LLM объяснить тему или помочь разобраться — она по умолчанию решает задачу вместо тебя, а не помогает тебе думать. Это называется «режим решения» (solve mode). Внешне выглядит как помощь, но ты получаешь ответ, не понимание.

Исследователи проверили восемь AI-тьюторов по двум независимым шкалам: насколько хорошо решают задачи и насколько хорошо обучают. Корреляция оказалась всего 0.42 — это слабая связь. Один из моделей (Qwen2.5-Math) занял 4-е место по решению задач и последнее место по педагогике. То есть: хорошо решает → не значит хорошо учит. Разрыв доходил до 45 пунктов.

Проблема в том, что LLM обучена быть «полезной» — а полезность ей говорит: дай правильный ответ. Без явной инструкции она не будет задавать наводящие вопросы, сдерживать подсказки и заставлять тебя думать самостоятельно. Исправляется это одним специфическим промптом — тьюторским режимом: ты явно запрещаешь модели раскрывать ответ и требуешь направлять твоё мышление через вопросы и дозированные подсказки.


🔬

Схема метода

Всё работает в одном промпте в начале диалога — задаёшь режим один раз, дальше ведёшь беседу.

ШАГ 1: Установить запрет → LLM не раскрывает ответ напрямую
ШАГ 2: Задать формат подсказок → минимум 2 наводящих вопроса вместо объяснения
ШАГ 3: Добавить проверку понимания → модель проверяет перед продвижением
ШАГ 4: Разрешить ответ только после → пока ты сам не придёшь или не сдашься

🚀

Пример применения

Задача: Маркетолог хочет разобраться в юнит-экономике — не получить ответ на вопрос, а по-настоящему понять как считать LTV и CAC. Обычно просто просит объяснить → получает лекцию → через час ничего не помнит.

Промпт:

Ты — мой личный преподаватель по юнит-экономике. Веди себя строго по этим правилам:

1. Никогда не давай готовый ответ или формулу напрямую, если я сам не попросил 
   явно написав "просто скажи ответ"
2. Вместо объяснения — задавай минимум 2 наводящих вопроса, чтобы я сам к нему пришёл
3. Если я ошибаюсь — не исправляй сразу. Дай подсказку-направление, не раскрывая шаг
4. Периодически проверяй: "Как ты сейчас понимаешь X своими словами?"
5. Продвигайся к следующей теме только когда я сам сформулировал вывод

Тема сегодня: как считать LTV (Lifetime Value) клиента для подписочного сервиса.
Начни с первого вопроса, который поможет мне самому сформулировать — что вообще такое LTV.

Результат: Вместо немедленного определения LTV — модель задаст вопрос про твой опыт с подписками или спросит: «Как ты думаешь, почему компании вообще хотят знать, сколько принесёт один клиент за всё время?» Ты начнёшь отвечать — модель будет направлять, уточнять, подталкивать. Только после того как ты сам сформулируешь понятие — перейдёт к формуле, и тоже не сразу, а через вопросы про компоненты.


🧠

Почему это работает

LLM обучена максимизировать "полезность" в понимании создателей — а полезность = правильный ответ + понятное объяснение. В этой логике промолчать или задать вопрос вместо объяснения выглядит как провал. Поэтому без специальной инструкции она всегда пойдёт по пути наименьшего сопротивления: выдаст ответ.

Но модель умеет имитировать педагогический диалог — в её обучающих данных есть тьюторские беседы, учебники с вопросами Сократа, обучающие диалоги. Нужно явно переключить её в этот режим. Когда ты запрещаешь раскрывать ответ, модель вынуждена строить другую стратегию — и обращается к паттернам из обучающих данных про наставничество.

Рычаги управления, которые можно менять:

  • Порог раскрытия — фраза «просто скажи ответ» как аварийный выход: убери её, если хочешь жёсткий режим без лазейки
  • Количество вопросов — «минимум 2» можно поднять до 3-4 для сложных концепций
  • Момент перехода — «только когда я сам сформулирую вывод» можно заменить на «только после 3 моих попыток»
  • Стиль преподавателя — добавь «ты — строгий профессор» или «ты — терпеливый ментор» для разной атмосферы

📋

Шаблон промпта

Ты — мой личный преподаватель по теме {тема}. 
Веди себя строго по правилам:

1. Не давай готовый ответ напрямую, пока я не напишу "{стоп-фраза}"
2. Вместо ответа — задавай минимум {число} наводящих вопросов
3. На ошибки реагируй подсказкой-направлением, не раскрывая шаг
4. Каждые {периодичность} проверяй понимание: "Как ты сейчас объяснишь {концепция} своими словами?"
5. Переходи к следующему блоку только после того как я сам сформулировал вывод

Начни с первого вопроса по теме: {стартовый вопрос}

Что подставлять: - {тема} — SQL-запросы, финансовая модель, питч-дек, стратегия переговоров - {стоп-фраза} — ключевое слово-выход когда нужен быстрый ответ: «просто ответь», «режим ответа» - {число} — 2 для обычных задач, 3-4 для сложных концепций - {периодичность} — «каждые 2-3 обмена», «после каждого блока» - {стартовый вопрос} — первый вопрос для входа в тему, формулируешь сам или просишь LLM предложить


🚀 Быстрый старт — вставь в чат:

Вот шаблон тьюторского режима. Адаптируй под мою задачу: [твоя задача]. 
Задавай вопросы чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит что именно ты хочешь понять и какой результат считается успехом — потому что без этого невозможно настроить момент перехода и глубину подсказок. Она возьмёт паттерн из шаблона и адаптирует под твою тему.


⚠️

Ограничения

⚠️ Модель может сломаться: При длинном диалоге LLM «забывает» режим и соскальзывает обратно в solve mode. Периодически напоминай: «Напоминаю — ты в режиме тьютора, не давай ответ».

⚠️ Не для срочных задач: Тьюторский режим требует времени и усилий. Если тебе нужен быстрый ответ — это не тот инструмент.

⚠️ Поверхностная педагогика: LLM умеет имитировать Сократический диалог, но не знает где именно ты застрял. Без явной обратной связи с твоей стороны — «вот мой ответ, где я ошибаюсь?» — качество наставничества снижается.

⚠️ Не измерено на реальном обучении: Исследование показало разрыв между моделями в педагогических метриках — не реальные результаты учеников. «Педагогически правильные подсказки» ≠ гарантия что ты лучше усвоишь материал.


🔍

Как исследовали

Авторы не создавали новый бенчмарк — они взяли уже существующие публичные данные и переанализировали их под другим углом. Из лидерборда MathTutorBench взяли 9 задач для 8 моделей и разделили их на два кластера: задачи на решение (правильность ответа, нахождение ошибок) и задачи на обучение (сократический диалог, scaffolding, следование педагогическим инструкциям). Посчитали средний балл каждой модели по каждому кластеру и сравнили.

Самый яркий случай — Qwen2.5-Math-7B: 0.568 по решению и 0.116 по педагогике. Разрыв — 0.45 пункта из 1. Это модель, заточенная под математику: она решает великолепно, но совершенно не умеет направлять ученика. Если бы смотрели только на суммарный балл — она выглядела бы средней. На лидерборде по решению — прочно в середине. По педагогике — последняя с большим отрывом.

Параллельно проанализировали TutorBench — 30 сценариев с 324 рубриками оценки тьютора. Оказалось, что в разделе «активное обучение» 100% критериев касаются сохранения самостоятельности ученика. Один из примеров рубрики дословно: «дать подсказку, задав не менее 2 наводящих вопросов, не раскрывая следующий шаг полностью». Это важно: педагогические требования уже записаны в бенчмарках — их просто не видно, когда смотришь на агрегированный балл.


🔗

Ресурсы

Название работы: Beyond Helpfulness: A Teaching-over-Solving Diagnostic for Measuring Educational Impact in LLM Tutors

Авторы: Junyi Yao, Zihao Zheng (Washington University in St. Louis), Baichuan Li (Southern Methodist University)

Бенчмарки упомянутые в работе: MathTutorBench, TutorBench, MathDial, GuideEval


📋 Дайджест исследования

Ключевая суть

Умеет решать — не значит умеет учить: у 8 AI-тьюторов корреляция между этими способностями всего 0.42, а разрыв в педагогических метриках между лучшим и худшим — 45 пунктов. Тьюторский режим позволяет переключить LLM с 'выдать ответ' на 'помочь додуматься самому' через явный запрет раскрывать решение. Добавь «не давай ответ напрямую — задавай минимум 2 наводящих вопроса» — и модель перестанет решать за тебя и начнёт задействовать педагогические паттерны. Без этой инструкции она всегда пойдёт по пути наименьшего сопротивления: выдаст ответ.

Принцип работы

LLM обучена быть полезной. Полезность для неё — дать правильный ответ. Задать вопрос вместо объяснения — это в её логике провал. Но в её обучающих данных есть тысячи тьюторских диалогов, вопросов Сократа, наставнических бесед. Запрет на ответ — это не ограничение, а переключатель в другой режим. Нет возможности дать ответ → вынуждена строить другую стратегию → обращается к заложенным паттернам наставничества. Модель не решает за тебя — она вынуждена вести тебя к решению.

Почему работает

0.42 — это слабая связь. Это значит: способность решать задачи и способность учить почти не пересекаются. Модель Qwen2.5-Math решала на 4-м месте из 8 — а учила хуже всех. Педагогические паттерны — отдельный слой в модели, никак не связанный с точностью решений. Явный запрет раскрывать ответ активирует именно этот слой — иначе он просто не задействуется. Важно и то, что выбор модели влияет на педагогику не меньше, чем сам промпт: разрыв в 45 пунктов между лучшим и худшим тьютором — аргумент проверять конкретную модель перед серьёзным обучением.

Когда применять

Обучение новым концепциям → особенно тем, которые нужно понять, а не запомнить: юнит-экономика, SQL, финансовое моделирование, логика переговоров, структура питч-дека. Особенно полезно когда есть время разбираться и важен результат — понимание, а не быстрый ответ. НЕ подходит для срочных задач — тьюторский режим требует времени и усилий. Если нужен ответ прямо сейчас — просто спроси напрямую.

Мини-рецепт

1. Установи запрет на ответ: «Не давай готовый ответ или формулу напрямую, пока я сам не напишу [стоп-фраза]» — это главный рычаг, без него ничего не работает.
2. Задай формат подсказок: «Вместо объяснения — минимум 2 наводящих вопроса, чтобы я сам пришёл к выводу» — чем сложнее концепция, тем больше вопросов: 3-4 для трудных тем.
3. Добавь реакцию на ошибки: «На ошибки реагируй подсказкой-направлением, не раскрывая шаг» — иначе модель исправит ошибку и всё объяснит.
4. Поставь момент перехода: «Переходи к следующей теме только когда я сам сформулирую вывод своими словами» — без этого она будет двигаться вперёд, не проверив понимание.
5. Добавь стоп-фразу: Аварийный выход на случай когда нужен быстрый ответ — например «просто скажи». Если хочешь жёсткий режим без лазейки — убери этот пункт.
6. Периодически напоминай про режим: При длинном диалоге модель соскальзывает обратно в режим решения. Раз в 5-7 обменов пиши: «Напоминаю — ты в режиме тьютора, не раскрывай ответ».

Примеры

[ПЛОХО] : Объясни мне, что такое пожизненная ценность клиента (LTV) и как её считать
[ХОРОШО] : Ты мой преподаватель по юнит-экономике. Строго соблюдай правила: 1) Не давай готовый ответ или формулу напрямую — пока я сам не напишу «просто скажи». 2) Вместо объяснения задавай минимум 2 наводящих вопроса. 3) На ошибки реагируй подсказкой-направлением, не решением. 4) Переходи дальше только когда я сам сформулирую вывод. Тема: пожизненная ценность клиента (LTV) для подписочного сервиса. Начни с первого вопроса — чтобы я сам додумался, зачем компании вообще считать эту метрику.
Источник: Measuring Whether LLM Tutors Teach or Solve: A Diagnostic for Educational Impact
ArXiv ID: 2606.16206 | Сгенерировано: 2026-06-16 05:35

Проблемы LLM

ПроблемаСутьКак обойти
Модель решает задачу вместо того чтобы учитьПросишь объяснить тему. Получаешь правильный ответ и готовое объяснение. Выглядит как помощь — но ты не думал сам. Не думал = не запомнил. Модель обучена быть «полезной». Полезность для неё = дать правильный ответ. Без явного запрета она всегда пойдёт этим путёмЗапрети раскрывать ответ явно. Потребуй наводящие вопросы вместо объяснений. Добавь проверку понимания. Смотри метод ниже

Методы

МетодСуть
Тьюторский запрос — модель учит, не отвечаетЗадай режим один раз в начале разговора. Структура запроса: (1) Не давай ответ, пока я не напишу "{стоп-фраза}". (2) Задавай минимум 2 наводящих вопроса вместо объяснения. (3) На ошибки отвечай подсказкой-направлением, не раскрывая шаг. (4) Каждые 2-3 обмена проверяй: "Объясни X своими словами". (5) Переходи дальше только когда я сам сформулировал вывод. Почему работает: В обучающих данных модели есть тьюторские диалоги и сократические беседы. Запрет на ответ закрывает путь наименьшего сопротивления — модель переключается на паттерны наставничества. Стоп-фраза — аварийный выход когда нужен быстрый ответ: «просто ответь», «режим ответа». Убери её для жёсткого режима без лазейки. Когда применять: хочешь понять, а не просто узнать. Когда не применять: нужен быстрый ответ, нет времени на диалог
📖 Простыми словами

Measuring WhetherLLMTutors Teach or Solve: A Diagnostic for Educational Impact

arXiv: 2606.16206

Проблема в том, что современные нейронки по своей природе — патологические угодники. Когда ты просишь ChatGPT помочь с задачей, её базовый инстинкт — вывалить на тебя готовое решение, чтобы казаться максимально полезной. Это фундаментальный баг для обучения: модель работает в режиме решения, а не в режиме наставника. Вместо того чтобы заставить твои мозги шевелиться, она просто делает работу за тебя, оставляя тебя с готовым результатом, но с абсолютно пустой головой.

Это как прийти в спортзал и смотреть, как тренер вместо тебя жмет штангу. Вроде бы упражнение выполняется, железо гремит, но твои мышцы от этого не растут. В образовании это полный провал: ты получаешь иллюзию понимания, которая рассыпается в прах, как только тебе приходится решать похожую задачу самостоятельно без подсказки под рукой.

Чтобы это исправить, нужно принудительно переключать LLM в режим тьютора через системный промпт. Суть метода в том, чтобы запретить модели давать прямые ответы и заставить её использовать сократовский метод. Вместо лекции она должна задавать наводящие вопросы, подсвечивать твои логические ошибки и давать ровно столько контекста, сколько нужно, чтобы ты сам дошел до сути. Исследование показывает, что один четкий промпт в начале диалога полностью меняет механику: нейронка перестает быть «решебником» и становится интеллектуальным костылем, который помогает идти, а не несет тебя на руках.

Принцип универсален и работает далеко за пределами школьной математики. Если ты маркетолог и хочешь реально въехать в юнит-экономику, не проси нейронку посчитать LTV. Попроси её проверить твой расчет или задать вопросы по твоим вводным данным. Это превращает пассивное потребление контента в активную практику. Тот же подход применим в программировании, менеджменте или изучении языков — везде, где тебе нужен навык, а не просто закрытая задача.

Короче, хватит использовать AI как продвинутый калькулятор, если хочешь чему-то научиться. Режим решения убивает обучение, превращая тебя в оператора копипасты. Нужно осознанно ломать этот паттерн «полезности» и заставлять модель быть вредной: пусть она не дает ответов, а задает правильные вопросы. Только так можно превратить чат-бота из шпаргалки в реального ментора, после общения с которым в голове что-то остается.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с