3,583 papers
arXiv:2512.05908 76 5 дек. 2025 г. PRO

NL-to-NL поиск: иерархический анализ через естественноязыковое описание

КЛЮЧЕВАЯ СУТЬ
Парадокс: искать проблему не в самих данных, а в их описаниях — в разы эффективнее. В системе из 46 репозиториев (1.1М строк кода) поиск по естественноязыковым описаниям нашёл нужный файл в 82% случаев против 23-62% у методов которые ищут напрямую в коде. Фишка: переводишь всё в единый формат — описания на естественном языке. Потом поиск идёт не "запрос → код", а "описание проблемы → описание компонента". LLM отлично понимает концептуальный смысл ("этот модуль отвечает за возвраты денег между Order и Payment"), но плохо работает с низкоуровневыми деталями ("вот 500 строк кода функции processRefund()"). Двухфазный поиск: сначала сужаешь область (46 репозиториев → топ-3), потом детализируешь (сотни файлов → топ-10). Каждый шаг прозрачен: репозиторий → директория → файл.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с