3,583 papers
arXiv:2504.20472 96 1 апр. 2025 г. PRO

Устойчивость через ссылку: защита от атак с внедрением подсказок путем ссылки на выполненную инструкцию.

КЛЮЧЕВАЯ СУТЬ
Заставляя LLM явно ссылаться на источник инструкции перед генерацией ответа, можно почти до нуля снизить успешность атак "внедрения промпта", просто игнорируя все ответы, не относящиеся к основной, помеченной задаче.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с