3,583 papers
arXiv:2506.06384 82 1 июня 2025 г. PRO

Метод обнаружения инъекций запросов путем интеграции предварительно обученной модели и эвристической инженерии признаков

КЛЮЧЕВАЯ СУТЬ
Исследователи создали ДВУХУРОВНЕВУЮ СИСТЕМУ ЗАЩИТЫ от вредоносных промптов: умный детектив (нейросеть DeBERTa) анализирует скрытый смысл, а быстрый охранник проверяет по списку «красных флагов» - запрещенных слов и подозрительных структур. Для пользователя главная ценность - понимание этого списка триггеров, чтобы случайно не попасть под блокировку при написании сложных промптов.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с