arXiv:2509.02558 82 2 сент. 2025 г. PRO

Освещая путь для BRIGHT: Воспроизводимые базовые показатели с Anserini, Pyserini и RankLLM

КЛЮЧЕВАЯ СУТЬ

Обнаружено: системы поиска в RAG воспринимают длинные промпты (16-256 токенов) не как набор равнозначных слов, а взвешивают каждый термин — редкие получают приоритет, частые игнорируются. Query-side BM25 позволяет находить в 2 раза более релевантные документы для развернутых запросов, которые типичны для чатов с LLM. Метод анализирует частотность слов внутри самого промпта и присваивает максимальный вес специфичным терминам ("agriturismo", "JTBD framework", "Brunello di Montalcino"), игнорируя общие ("стратегия", "план", "анализ") — точность поиска растет с 40% до 78% для запросов длиннее 50 токенов.

Адаптировать под запрос

Контент доступен только для PRO подписчиков

Чтобы получить доступ к полному содержанию этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

Выберите модель ИИ:

Ваш запрос:

0 / 2000

~0.5-2 N-токенов ~10-30с

~0.3-1 N-токенов ~5-15с

Меню

Освещая путь для BRIGHT: Воспроизводимые базовые показатели с Anserini, Pyserini и RankLLM

Контент доступен только для PRO подписчиков

Работа с исследованием

Результат адаптации