RAGuard: Явное разделение критического контекста в RAG
КЛЮЧЕВАЯ СУТЬ
Стандартный RAG пропускает обязательные требования почти полностью. Спрашиваешь про процедуру запуска оборудования — модель находит 10 технических инструкций, но игнорирует критичные правила безопасности. Причина: поиск по релевантности не различает "полезное" и "обязательное" — алгоритм ранжирует всё в одной куче, и формальные документы (compliance, регуляции) проигрывают живым техническим текстам.
RAGuard позволяет гарантировать попадание критического контекста (безопасность, законодательство, регуляции) в промпт модели, даже если он семантически дальше от запроса. Метод создаёт два параллельных индекса с зарезервированными слотами: например, 3 фрагмента из технических мануалов + 7 фрагментов из правил безопасности. Модель физически получает N кусков из одного индекса и M из другого — невозможно "забыть" про критический контекст, он гарантированно попадёт в промпт.