TutorBench – методика трёх режимов для образовательных запросов к LLM
КЛЮЧЕВАЯ СУТЬ
Бенчмарк TutorBench выявил критическую проблему: даже топовые LLM (GPT-4, Claude, Gemini) справляются с ролью репетитора лишь на 56% — модели по умолчанию стремятся выдать готовый ответ, что убивает обучение. Исследование позволяет превратить LLM в настоящего наставника через явное указание одного из трёх режимов работы. Вместо общих вопросов типа «Объясни инфляцию» пользователь классифицирует свой запрос: нужно ли адаптивное объяснение конкретного непонимания, оценка готовой работы или активная поддержка (наводящие вопросы без готового решения). Ключевая фишка: добавление явного ограничителя «НЕ ДАВАЙ готовый ответ, ВМЕСТО ЭТОГО задай наводящий вопрос» заставляет модель переключиться из режима «всезнайки» в режим «тренера» — именно с этим третьим режимом модели справляются хуже всего без явных инструкций.