3,583 papers
arXiv:2605.17480 76 17 мая 2026 г. PRO

Capability Paradox + Heterogeneous Ensemble: умный AI уверен сильнее, чем прав — проверяй двумя несовместимыми агентами

КЛЮЧЕВАЯ СУТЬ
Чем умнее модель, тем опаснее её уверенность. Когда вредоносный запрос завёрнут в правдоподобный профессиональный контекст (отчёт, экспертное заключение, аналитическая записка) — продвинутые модели не чаще его отлавливают. Наоборот: они убедительнее «объясняют», почему это нормально, и передают вывод дальше в авторитетном тоне. Вторая модель (или человек) слышит уверенный голос эксперта — и принимает его за разрешение действовать.
Адаптировать под запрос

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с