3,583 papers
arXiv:2605.18133 70 18 мая 2026 г. PRO

Exemplification Attack: почему ваш ИИ-агент с веб-доступом — потенциальная дыра в вашей приватности

КЛЮЧЕВАЯ СУТЬ
То, что делает LLM умными — их же и топит. Модели блестяще подхватывают паттерны из примеров в контексте (именно на этом работает few-shot обучение). Exemplification attack переворачивает эту механику: злоумышленник встраивает в стороннюю страницу фальшивый «образец поведения» — и ИИ-агент продолжает паттерн, а не ваше задание. Метод позволяет выстроить полную цепочку от «открой эту ссылку» до утечки данных из памяти агента — в рамках одного диалога. Результат: 72% успешных атак против 3% у старых методов — в 24 раза эффективнее. Прямая команда «сделай плохое» блокируется. Образец «вот как ты уже отвечал на такие запросы» — выполняется.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с