3,583 papers
arXiv:2509.02558 82 2 сент. 2025 г. PRO

Освещая путь для BRIGHT: Воспроизводимые базовые показатели с Anserini, Pyserini и RankLLM

КЛЮЧЕВАЯ СУТЬ
Обнаружено: системы поиска в RAG воспринимают длинные промпты (16-256 токенов) не как набор равнозначных слов, а взвешивают каждый термин — редкие получают приоритет, частые игнорируются. Query-side BM25 позволяет находить в 2 раза более релевантные документы для развернутых запросов, которые типичны для чатов с LLM. Метод анализирует частотность слов внутри самого промпта и присваивает максимальный вес специфичным терминам ("agriturismo", "JTBD framework", "Brunello di Montalcino"), игнорируя общие ("стратегия", "план", "анализ") — точность поиска растет с 40% до 78% для запросов длиннее 50 токенов.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с