Расширение запросов в эпоху предварительно обученных и больших языковых моделей: Комплексный обзор
КЛЮЧЕВАЯ СУТЬ
Обнаружено: LLM катастрофически плохи в поиске по коротким запросам из-за "vocabulary mismatch" — вы пишете "лучший телефон для фото", а в идеальной статье используются термины "сенсор", "апертура f/1.8", "вычислительная фотография". Метод Query Expansion позволяет находить релевантную информацию даже по расплывчатым запросам, заставляя модель сначала обогатить сам запрос. Вместо прямого поиска вы просите LLM сгенерировать гипотетический идеальный ответ на ваш вопрос, а затем используете этот богатый текст как новый поисковый запрос — точность находимой информации вырастает в разы, потому что расширенный запрос содержит все нужные ключевые слова и концепции.