3,583 papers
arXiv:2506.05446 65 1 июня 2025 г. PRO

Сентинел SOTA модель защиты от вставок промптов

КЛЮЧЕВАЯ СУТЬ
Sentinel — это МОДЕЛЬ-ОХРАННИК, которая проверяет каждый промпт перед тем, как он попадет к основной LLM. Она обучена на тысячах примеров вредоносных атак и определяет с точностью 98.7%, пытается ли пользователь "взломать" систему через промпт. ГЛАВНАЯ ИДЕЯ: LLM не умеют отличать ваши реальные инструкции от инструкций, которые вы просите их симулировать — это фундаментальная уязвимость.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с