3,583 papers
arXiv:2510.17139 82 20 окт. 2025 г. PRO

SPQE: генерация псевдо-документа для точного поиска

КЛЮЧЕВАЯ СУТЬ
Парадокс: Уточнение запроса («найди кейсы по снижению оттока») работает хуже, чем генерация полноценного псевдо-документа. Причина – асимметрия: запрос это 5-10 слов, документ – сотни слов. Поисковики (особенно семантические) обучены сравнивать документы с документами, а не короткие запросы с длинными текстами. Метод SPQE позволяет находить релевантные документы в базах знаний и Projects даже когда они используют другую терминологию или структуру, чем ваш запрос. Фишка: просишь LLM написать гипотетический документ-ответ (200-300 слов) вместо короткого запроса. Поиск превращается в задачу «найди документ похожий на этот документ». На базовых бенчмарках zero-shot промпт обошёл сложные RL-методы на sparse-поисковиках и показал конкурентные результаты на dense-поисковиках – без обучения на GPU и размеченных данных.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с