3,583 papers
arXiv:2512.03180 76 2 дек. 2025 г. PRO

Принципы управления рисками из AGENTSAFE: как не дать агентной LLM уйти в занос

КЛЮЧЕВАЯ СУТЬ
Знакомая боль: дал GPT Projects задачу написать HR-отчёт, через 20 сообщений она анализирует конкурентов и генерит мемы. Это plan drift — агентная LLM постепенно смещает контекст и уходит от исходной цели. AGENTSAFE — первый систематический фреймворк для управления рисками таких систем. Фишка: переносит enterprise-контроли из кода в промпты — профилируешь возможности агента → задаёшь правила эскалации → встраиваешь периодическую самопроверку на drift → требуешь показывать граф действий. Применимо прямо сейчас в GPT/Claude Projects.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с