3,583 papers
arXiv:2605.27784 74 27 мая 2026 г. PRO

WIRE: скрытые конфликты правил в системных промптах — модель нарушает ваши инструкции молча

КЛЮЧЕВАЯ СУТЬ
В 65% случаев, когда два правила из одного промпта одновременно управляют ситуацией, модель нарушает хотя бы одно. Не потому что правила плохие. Она генерирует токен за токеном — и при давлении двух ограничений одно случайно проигрывает, без осознанного выбора. Метод WIRE даёт возможность найти такие скрытые конфликтные пары до того, как они начнут ломать поведение вашего ассистента. Фишка: превращаем ту же модель из исполнителя конфликтующих правил в аналитика, который эти конфликты ищет — просишь явно проверить правила на совместимость, а не просто выполнять их. Получаешь: конкретную пару правил + запрос-триггер + что именно нарушается.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с