3,583 papers
arXiv:2505.16122 95 1 мая 2025 г. PRO

Планирование и бюджетирование: эффективное и результативное масштабирование времени тестирования на больших языковых моделях.

КЛЮЧЕВАЯ СУТЬ
LLM страдают от НЕПРАВИЛЬНОЙ КАЛИБРОВКИ РАССУЖДЕНИЙ: они либо overthinking (избыточно обдумывают простые задачи), либо underthinking (поверхностно решают сложные). Метод решает это через ДВУХЭТАПНЫЙ ПОДХОД: сначала разбиваешь запрос на последовательность простых подзадач, затем для каждой указываешь желаемый уровень детализации.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с