3,583 papers
arXiv:2508.09539 88 19 авг. 2025 г. PRO

TFRank: Свободное от размышлений рассуждение обеспечивает практическое ранжирование LLM по точкам

КЛЮЧЕВАЯ СУТЬ
Обнаружено: LLM, обученные на задачах с рассуждениями, выдают более точные оценки, когда их заставляют молчать — не объяснять выбор, а только озвучить результат. TFRank позволяет получать более точные оценки и ранжирования без потери качества, которое дают рассуждения. Команда /no think блокирует вывод текста рассуждений, заставляя модель полагаться на интернализованную логикуточность ранжирования выросла, а скорость увеличилась в разы по сравнению с полным Chain-of-Thought.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с