3,583 papers
arXiv:2606.16244 74 15 июня 2026 г. PRO

SPARK: активация скрытых знаний LLM через явные сигналы уязвимостей

КЛЮЧЕВАЯ СУТЬ
Парадокс: языковая модель уже ЗНАЕТ про SQL-инъекции, переполнение буфера и подмену скриптов (XSS). Всё это было в обучении — тысячи CVE-баз, каталоги слабых мест (CWE), разборы уязвимостей на Stack Overflow. Но без явного сигнала она всё равно пишет небезопасный код — потому что в обучающих данных большинство кода было функциональным, но уязвимым. Разработчики пишут чтобы работало, а не чтобы выдержало атаку. Это называют дремлющими знаниями: модель их подавляет статистическим давлением «типичного паттерна». SPARK позволяет разбудить эти знания одним приёмом: добавь в конец промпта блок с конкретными классами уязвимостей — и модель переключится в режим «пишу с учётом угроз». Ключевой момент: CWE-блок ставится суффиксом — последним в промпте, ПОСЛЕ задачи. Это последнее что модель обрабатывает перед генерацией. Без этого приёма даже лучшие коммерческие модели выдают безопасный код лишь в 5.6–34.5% случаев.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с