arXiv:2606.16206 73 15 июня 2026 г. FREE

Тьюторский режим: как заставить LLM учить, а не решать за тебя

КЛЮЧЕВАЯ СУТЬ

Умеет решать — не значит умеет учить: у 8 AI-тьюторов корреляция между этими способностями всего 0.42, а разрыв в педагогических метриках между лучшим и худшим — 45 пунктов. Тьюторский режим позволяет переключить LLM с 'выдать ответ' на 'помочь додуматься самому' через явный запрет раскрывать решение. Добавь «не давай ответ напрямую — задавай минимум 2 наводящих вопроса» — и модель перестанет решать за тебя и начнёт задействовать педагогические паттерны. Без этой инструкции она всегда пойдёт по пути наименьшего сопротивления: выдаст ответ.

Адаптировать под запрос

⚡

TL;DR

Когда просишь LLM объяснить тему или помочь разобраться — она по умолчанию решает задачу вместо тебя, а не помогает тебе думать. Это называется «режим решения» (solve mode). Внешне выглядит как помощь, но ты получаешь ответ, не понимание.

Исследователи проверили восемь AI-тьюторов по двум независимым шкалам: насколько хорошо решают задачи и насколько хорошо обучают. Корреляция оказалась всего 0.42 — это слабая связь. Один из моделей (Qwen2.5-Math) занял 4-е место по решению задач и последнее место по педагогике. То есть: хорошо решает → не значит хорошо учит. Разрыв доходил до 45 пунктов.

Проблема в том, что LLM обучена быть «полезной» — а полезность ей говорит: дай правильный ответ. Без явной инструкции она не будет задавать наводящие вопросы, сдерживать подсказки и заставлять тебя думать самостоятельно. Исправляется это одним специфическим промптом — тьюторским режимом: ты явно запрещаешь модели раскрывать ответ и требуешь направлять твоё мышление через вопросы и дозированные подсказки.

🔬

Схема метода

Всё работает в одном промпте в начале диалога — задаёшь режим один раз, дальше ведёшь беседу.

ШАГ 1: Установить запрет → LLM не раскрывает ответ напрямую
ШАГ 2: Задать формат подсказок → минимум 2 наводящих вопроса вместо объяснения
ШАГ 3: Добавить проверку понимания → модель проверяет перед продвижением
ШАГ 4: Разрешить ответ только после → пока ты сам не придёшь или не сдашься

🚀

Пример применения

Задача: Маркетолог хочет разобраться в юнит-экономике — не получить ответ на вопрос, а по-настоящему понять как считать LTV и CAC. Обычно просто просит объяснить → получает лекцию → через час ничего не помнит.

Промпт:

Ты — мой личный преподаватель по юнит-экономике. Веди себя строго по этим правилам:

1. Никогда не давай готовый ответ или формулу напрямую, если я сам не попросил 
   явно написав "просто скажи ответ"
2. Вместо объяснения — задавай минимум 2 наводящих вопроса, чтобы я сам к нему пришёл
3. Если я ошибаюсь — не исправляй сразу. Дай подсказку-направление, не раскрывая шаг
4. Периодически проверяй: "Как ты сейчас понимаешь X своими словами?"
5. Продвигайся к следующей теме только когда я сам сформулировал вывод

Тема сегодня: как считать LTV (Lifetime Value) клиента для подписочного сервиса.
Начни с первого вопроса, который поможет мне самому сформулировать — что вообще такое LTV.

Результат: Вместо немедленного определения LTV — модель задаст вопрос про твой опыт с подписками или спросит: «Как ты думаешь, почему компании вообще хотят знать, сколько принесёт один клиент за всё время?» Ты начнёшь отвечать — модель будет направлять, уточнять, подталкивать. Только после того как ты сам сформулируешь понятие — перейдёт к формуле, и тоже не сразу, а через вопросы про компоненты.

🧠

Почему это работает

LLM обучена максимизировать "полезность" в понимании создателей — а полезность = правильный ответ + понятное объяснение. В этой логике промолчать или задать вопрос вместо объяснения выглядит как провал. Поэтому без специальной инструкции она всегда пойдёт по пути наименьшего сопротивления: выдаст ответ.

Но модель умеет имитировать педагогический диалог — в её обучающих данных есть тьюторские беседы, учебники с вопросами Сократа, обучающие диалоги. Нужно явно переключить её в этот режим. Когда ты запрещаешь раскрывать ответ, модель вынуждена строить другую стратегию — и обращается к паттернам из обучающих данных про наставничество.

Рычаги управления, которые можно менять:

Порог раскрытия — фраза «просто скажи ответ» как аварийный выход: убери её, если хочешь жёсткий режим без лазейки
Количество вопросов — «минимум 2» можно поднять до 3-4 для сложных концепций
Момент перехода — «только когда я сам сформулирую вывод» можно заменить на «только после 3 моих попыток»
Стиль преподавателя — добавь «ты — строгий профессор» или «ты — терпеливый ментор» для разной атмосферы

📋

Шаблон промпта

Ты — мой личный преподаватель по теме {тема}. 
Веди себя строго по правилам:

1. Не давай готовый ответ напрямую, пока я не напишу "{стоп-фраза}"
2. Вместо ответа — задавай минимум {число} наводящих вопросов
3. На ошибки реагируй подсказкой-направлением, не раскрывая шаг
4. Каждые {периодичность} проверяй понимание: "Как ты сейчас объяснишь {концепция} своими словами?"
5. Переходи к следующему блоку только после того как я сам сформулировал вывод

Начни с первого вопроса по теме: {стартовый вопрос}

Что подставлять: - {тема} — SQL-запросы, финансовая модель, питч-дек, стратегия переговоров - {стоп-фраза} — ключевое слово-выход когда нужен быстрый ответ: «просто ответь», «режим ответа» - {число} — 2 для обычных задач, 3-4 для сложных концепций - {периодичность} — «каждые 2-3 обмена», «после каждого блока» - {стартовый вопрос} — первый вопрос для входа в тему, формулируешь сам или просишь LLM предложить

🚀 Быстрый старт — вставь в чат:

Вот шаблон тьюторского режима. Адаптируй под мою задачу: [твоя задача]. 
Задавай вопросы чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит что именно ты хочешь понять и какой результат считается успехом — потому что без этого невозможно настроить момент перехода и глубину подсказок. Она возьмёт паттерн из шаблона и адаптирует под твою тему.

⚠️

Ограничения

⚠️ Модель может сломаться: При длинном диалоге LLM «забывает» режим и соскальзывает обратно в solve mode. Периодически напоминай: «Напоминаю — ты в режиме тьютора, не давай ответ».

⚠️ Не для срочных задач: Тьюторский режим требует времени и усилий. Если тебе нужен быстрый ответ — это не тот инструмент.

⚠️ Поверхностная педагогика: LLM умеет имитировать Сократический диалог, но не знает где именно ты застрял. Без явной обратной связи с твоей стороны — «вот мой ответ, где я ошибаюсь?» — качество наставничества снижается.

⚠️ Не измерено на реальном обучении: Исследование показало разрыв между моделями в педагогических метриках — не реальные результаты учеников. «Педагогически правильные подсказки» ≠ гарантия что ты лучше усвоишь материал.

🔍

Как исследовали

Авторы не создавали новый бенчмарк — они взяли уже существующие публичные данные и переанализировали их под другим углом. Из лидерборда MathTutorBench взяли 9 задач для 8 моделей и разделили их на два кластера: задачи на решение (правильность ответа, нахождение ошибок) и задачи на обучение (сократический диалог, scaffolding, следование педагогическим инструкциям). Посчитали средний балл каждой модели по каждому кластеру и сравнили.

Самый яркий случай — Qwen2.5-Math-7B: 0.568 по решению и 0.116 по педагогике. Разрыв — 0.45 пункта из 1. Это модель, заточенная под математику: она решает великолепно, но совершенно не умеет направлять ученика. Если бы смотрели только на суммарный балл — она выглядела бы средней. На лидерборде по решению — прочно в середине. По педагогике — последняя с большим отрывом.

Параллельно проанализировали TutorBench — 30 сценариев с 324 рубриками оценки тьютора. Оказалось, что в разделе «активное обучение» 100% критериев касаются сохранения самостоятельности ученика. Один из примеров рубрики дословно: «дать подсказку, задав не менее 2 наводящих вопросов, не раскрывая следующий шаг полностью». Это важно: педагогические требования уже записаны в бенчмарках — их просто не видно, когда смотришь на агрегированный балл.

🔗

Ресурсы

Название работы: Beyond Helpfulness: A Teaching-over-Solving Diagnostic for Measuring Educational Impact in LLM Tutors

Авторы: Junyi Yao, Zihao Zheng (Washington University in St. Louis), Baichuan Li (Southern Methodist University)

Бенчмарки упомянутые в работе: MathTutorBench, TutorBench, MathDial, GuideEval

📋 Дайджест исследования

Ключевая суть

Принцип работы

LLM обучена быть полезной. Полезность для неё — дать правильный ответ. Задать вопрос вместо объяснения — это в её логике провал. Но в её обучающих данных есть тысячи тьюторских диалогов, вопросов Сократа, наставнических бесед. Запрет на ответ — это не ограничение, а переключатель в другой режим. Нет возможности дать ответ → вынуждена строить другую стратегию → обращается к заложенным паттернам наставничества. Модель не решает за тебя — она вынуждена вести тебя к решению.

Почему работает

0.42 — это слабая связь. Это значит: способность решать задачи и способность учить почти не пересекаются. Модель Qwen2.5-Math решала на 4-м месте из 8 — а учила хуже всех. Педагогические паттерны — отдельный слой в модели, никак не связанный с точностью решений. Явный запрет раскрывать ответ активирует именно этот слой — иначе он просто не задействуется. Важно и то, что выбор модели влияет на педагогику не меньше, чем сам промпт: разрыв в 45 пунктов между лучшим и худшим тьютором — аргумент проверять конкретную модель перед серьёзным обучением.

Когда применять

Обучение новым концепциям → особенно тем, которые нужно понять, а не запомнить: юнит-экономика, SQL, финансовое моделирование, логика переговоров, структура питч-дека. Особенно полезно когда есть время разбираться и важен результат — понимание, а не быстрый ответ. НЕ подходит для срочных задач — тьюторский режим требует времени и усилий. Если нужен ответ прямо сейчас — просто спроси напрямую.

Мини-рецепт

1. Установи запрет на ответ: «Не давай готовый ответ или формулу напрямую, пока я сам не напишу [стоп-фраза]» — это главный рычаг, без него ничего не работает.
2. Задай формат подсказок: «Вместо объяснения — минимум 2 наводящих вопроса, чтобы я сам пришёл к выводу» — чем сложнее концепция, тем больше вопросов: 3-4 для трудных тем.
3. Добавь реакцию на ошибки: «На ошибки реагируй подсказкой-направлением, не раскрывая шаг» — иначе модель исправит ошибку и всё объяснит.
4. Поставь момент перехода: «Переходи к следующей теме только когда я сам сформулирую вывод своими словами» — без этого она будет двигаться вперёд, не проверив понимание.
5. Добавь стоп-фразу: Аварийный выход на случай когда нужен быстрый ответ — например «просто скажи». Если хочешь жёсткий режим без лазейки — убери этот пункт.
6. Периодически напоминай про режим: При длинном диалоге модель соскальзывает обратно в режим решения. Раз в 5-7 обменов пиши: «Напоминаю — ты в режиме тьютора, не раскрывай ответ».

Примеры

[ПЛОХО] :

Объясни мне, что такое пожизненная ценность клиента (LTV) и как её считать

[ХОРОШО] :

Ты мой преподаватель по юнит-экономике. Строго соблюдай правила: 1) Не давай готовый ответ или формулу напрямую — пока я сам не напишу «просто скажи». 2) Вместо объяснения задавай минимум 2 наводящих вопроса. 3) На ошибки реагируй подсказкой-направлением, не решением. 4) Переходи дальше только когда я сам сформулирую вывод. Тема: пожизненная ценность клиента (LTV) для подписочного сервиса. Начни с первого вопроса — чтобы я сам додумался, зачем компании вообще считать эту метрику.

Источник: Measuring Whether LLM Tutors Teach or Solve: A Diagnostic for Educational Impact

ArXiv ID: 2606.16206 | Сгенерировано: 2026-06-16 05:35

Проблемы LLM

Проблема	Суть	Как обойти
Модель решает задачу вместо того чтобы учить	Просишь объяснить тему. Получаешь правильный ответ и готовое объяснение. Выглядит как помощь — но ты не думал сам. Не думал = не запомнил. Модель обучена быть «полезной». Полезность для неё = дать правильный ответ. Без явного запрета она всегда пойдёт этим путём	Запрети раскрывать ответ явно. Потребуй наводящие вопросы вместо объяснений. Добавь проверку понимания. Смотри метод ниже

Методы

Метод Суть

Тьюторский запрос — модель учит, не отвечает Задай режим один раз в начале разговора. Структура запроса: (1) Не давай ответ, пока я не напишу "{стоп-фраза}". (2) Задавай минимум 2 наводящих вопроса вместо объяснения. (3) На ошибки отвечай подсказкой-направлением, не раскрывая шаг. (4) Каждые 2-3 обмена проверяй: "Объясни X своими словами". (5) Переходи дальше только когда я сам сформулировал вывод. Почему работает: В обучающих данных модели есть тьюторские диалоги и сократические беседы. Запрет на ответ закрывает путь наименьшего сопротивления — модель переключается на паттерны наставничества. Стоп-фраза — аварийный выход когда нужен быстрый ответ: «просто ответь», «режим ответа». Убери её для жёсткого режима без лазейки. Когда применять: хочешь понять, а не просто узнать. Когда не применять: нужен быстрый ответ, нет времени на диалог

Метод	Суть
Тьюторский запрос — модель учит, не отвечает	Задай режим один раз в начале разговора. Структура запроса: (1) Не давай ответ, пока я не напишу "{стоп-фраза}". (2) Задавай минимум 2 наводящих вопроса вместо объяснения. (3) На ошибки отвечай подсказкой-направлением, не раскрывая шаг. (4) Каждые 2-3 обмена проверяй: "Объясни X своими словами". (5) Переходи дальше только когда я сам сформулировал вывод. Почему работает: В обучающих данных модели есть тьюторские диалоги и сократические беседы. Запрет на ответ закрывает путь наименьшего сопротивления — модель переключается на паттерны наставничества. Стоп-фраза — аварийный выход когда нужен быстрый ответ: «просто ответь», «режим ответа». Убери её для жёсткого режима без лазейки. Когда применять: хочешь понять, а не просто узнать. Когда не применять: нужен быстрый ответ, нет времени на диалог

📖 Простыми словами

Measuring WhetherLLMTutors Teach or Solve: A Diagnostic for Educational Impact

arXiv: 2606.16206

Проблема в том, что современные нейронки по своей природе — патологические угодники. Когда ты просишь ChatGPT помочь с задачей, её базовый инстинкт — вывалить на тебя готовое решение, чтобы казаться максимально полезной. Это фундаментальный баг для обучения: модель работает в режиме решения, а не в режиме наставника. Вместо того чтобы заставить твои мозги шевелиться, она просто делает работу за тебя, оставляя тебя с готовым результатом, но с абсолютно пустой головой.

Это как прийти в спортзал и смотреть, как тренер вместо тебя жмет штангу. Вроде бы упражнение выполняется, железо гремит, но твои мышцы от этого не растут. В образовании это полный провал: ты получаешь иллюзию понимания, которая рассыпается в прах, как только тебе приходится решать похожую задачу самостоятельно без подсказки под рукой.

Чтобы это исправить, нужно принудительно переключать LLM в режим тьютора через системный промпт. Суть метода в том, чтобы запретить модели давать прямые ответы и заставить её использовать сократовский метод. Вместо лекции она должна задавать наводящие вопросы, подсвечивать твои логические ошибки и давать ровно столько контекста, сколько нужно, чтобы ты сам дошел до сути. Исследование показывает, что один четкий промпт в начале диалога полностью меняет механику: нейронка перестает быть «решебником» и становится интеллектуальным костылем, который помогает идти, а не несет тебя на руках.

Принцип универсален и работает далеко за пределами школьной математики. Если ты маркетолог и хочешь реально въехать в юнит-экономику, не проси нейронку посчитать LTV. Попроси её проверить твой расчет или задать вопросы по твоим вводным данным. Это превращает пассивное потребление контента в активную практику. Тот же подход применим в программировании, менеджменте или изучении языков — везде, где тебе нужен навык, а не просто закрытая задача.

Короче, хватит использовать AI как продвинутый калькулятор, если хочешь чему-то научиться. Режим решения убивает обучение, превращая тебя в оператора копипасты. Нужно осознанно ломать этот паттерн «полезности» и заставлять модель быть вредной: пусть она не дает ответов, а задает правильные вопросы. Только так можно превратить чат-бота из шпаргалки в реального ментора, после общения с которым в голове что-то остается.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

Выберите модель ИИ:

Ваш запрос:

0 / 2000

~0.5-2 N-токенов ~10-30с

~0.3-1 N-токенов ~5-15с

Меню