3,583 papers
arXiv:2505.14368 92 1 мая 2025 г. PRO

Ваш запрос безопасен? Исследование атак с инъекцией запросов против открытых LLM.

КЛЮЧЕВАЯ СУТЬ
Исследование показывает три способа ОБМАНУТЬ языковые модели, заставив их игнорировать правила безопасности. Главная техника — «атака гипнозом» — сначала отвлекает модель простым заданием, а потом подсовывает основную инструкцию. Вместо логического убеждения используется ПСИХОЛОГИЧЕСКАЯ МАНИПУЛЯЦИЯ через создание «покладистого контекста».
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с