3,583 papers
arXiv:2510.02663 68 3 окт. 2025 г. PRO

TutorBench – методика трёх режимов для образовательных запросов к LLM

КЛЮЧЕВАЯ СУТЬ
Бенчмарк TutorBench выявил критическую проблему: даже топовые LLM (GPT-4, Claude, Gemini) справляются с ролью репетитора лишь на 56% — модели по умолчанию стремятся выдать готовый ответ, что убивает обучение. Исследование позволяет превратить LLM в настоящего наставника через явное указание одного из трёх режимов работы. Вместо общих вопросов типа «Объясни инфляцию» пользователь классифицирует свой запрос: нужно ли адаптивное объяснение конкретного непонимания, оценка готовой работы или активная поддержка (наводящие вопросы без готового решения). Ключевая фишка: добавление явного ограничителя «НЕ ДАВАЙ готовый ответ, ВМЕСТО ЭТОГО задай наводящий вопрос» заставляет модель переключиться из режима «всезнайки» в режим «тренера» — именно с этим третьим режимом модели справляются хуже всего без явных инструкций.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с