3,583 papers
arXiv:2506.00309 92 1 июня 2025 г. PRO

Оценка больших языковых моделей для решения математических задач

КЛЮЧЕВАЯ СУТЬ
Вместо надежды на то, что LLM сама выдаст полный ответ, мы используем знание о ТИПИЧНЫХ ОШИБКАХ конкретных моделей для формулирования инструкций, которые напрямую запрещают эти ошибки. Исследование выявило 4 главные проблемы: недостаток обоснования, пропуск промежуточных шагов, плохую структуру и многословие. ПРЕВЕНТИВНЫЙ ПОДХОД означает, что мы заранее "подкладываем соломку" в виде четких инструкций там, где модель может споткнуться.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с