3,583 papers
arXiv:2505.15712 92 1 мая 2025 г. PRO

TurnaboutLLM - Бенчмарк дедуктивного мышления из детективных игр

КЛЮЧЕВАЯ СУТЬ
Для решения сложных логических задач с большим количеством фактов нужно отказаться от CHAIN-OF-THOUGHT промптинга и заставить модель проводить методичный исчерпывающий перебор всех возможных комбинаций. LLM работает не как гениальный детектив, а как УСЕРДНЫЙ АРХИВАРИУС, который должен систематически сопоставить каждое утверждение с каждым фактом.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с