3,583 papers
arXiv:2505.14963 92 1 мая 2025 г. PRO

MedBrowseComp - Бенчмаркинг медицинских глубоких исследований и использования компьютеров

КЛЮЧЕВАЯ СУТЬ
Исследование показало, что ИИ КАТАСТРОФИЧЕСКИ ТЕРЯЕТ ТОЧНОСТЬ при выполнении задач, требующих более 2-3 последовательных шагов поиска информации. Принцип multi-hop означает, что каждый дополнительный «прыжок» между источниками данных становится точкой потенциального отказа. Вместо одного сложного запроса нужно создавать цепочку простых, проверяемых шагов.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с