3,583 papers
arXiv:2504.18333 95 1 апр. 2025 г. PRO

Атаки противодействия на системы LLM в роли судей: выводы из инъекций запросов

КЛЮЧЕВАЯ СУТЬ
Структурированный промпт, который сначала создает видимость нормальной задачи, затем резко "ломает" контекст с помощью разделителей и авторитетных фраз, а после этого дает прямой приказ, — чрезвычайно эффективен для управления поведением LLM.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с