3,583 papers
arXiv:2505.12368 95 1 мая 2025 г. PRO

CAPTURE - Тестирование инъекций подсказок с учетом контекста и повышение устойчивости

КЛЮЧЕВАЯ СУТЬ
Исследование раскрывает СТРУКТУРНУЮ УЯЗВИМОСТЬ LLM: модель может проигнорировать основную задачу, если в промпте есть фраза-переключатель контекста. Любая фраза типа "кстати", "забудь об этом", "давай сменим тему" может заставить модель отбросить всё предыдущее и выполнить только последнюю инструкцию. Это происходит из-за трёхчастной структуры: РАМКА (основная задача) + РАЗДЕЛИТЕЛЬ (фраза смены контекста) + РАЗРУШИТЕЛЬ (новая задача).
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с