3,583 papers
arXiv:2605.05427 74 6 мая 2026 г. PRO

Геополитика безопасности ИИ: почему модель отказывает не из-за вашего запроса, а из-за страны происхождения

КЛЮЧЕВАЯ СУТЬ
Llama отказала на 11% абсолютно нейтральных запросов — просто потому что там мелькнуло слово «евреи». Не токсичный контент, не агрессия, не манипуляция. Одно демографическое слово. Исследование впервые разделило два типа отказов: обоснованный (тема реально токсична) и ложный (тема безобидна, но фильтр сорвался). Это позволяет понять почему именно заблокировали запрос — и выбрать стратегию. Фишка: ложный отказ диагностируется за 30 секунд — убери демографическое слово и отправь запрос снова. Ответила? Значит, сработал триггер на слово, а не на смысл.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с