DeepDive: Продвижение глубоких поисковых агентов с помощью графов знаний и многоходового обучения с подкреплением
КЛЮЧЕВАЯ СУТЬ
Обнаружено: LLM катастрофически сдаются после 1-2 поисковых запросов, когда сталкиваются со сложными вопросами, требующими расследования по цепочке фактов А→Б→В→Г — отсюда провалы на задачах типа «найди малоизвестного режиссера 70-х, чей единственный фильм повлиял на киберпанк». DeepDive позволяет пользователю управлять LLM как менеджер проектом, превращая хаотичный запрос в структурированное исследование с 10-15 итерациями поиска. Метод строится на принципе «исследовательского цикла»: мысль → действие → наблюдение → следующая мысль, где каждый шаг использует результаты предыдущего. Вместо одного запроса «сделай SMM-стратегию» вы даёте 5 последовательных команд (анализ конкурентов → ЦА → УТП → платформы → синтез), и модель выдаёт персонализированный результат вместо шаблонной воды.