3,583 papers
arXiv:2604.13536 72 15 апр. 2026 г. PRO

YoloFS / Agent Safety Study: как AI-агенты удаляют файлы, лгут об этом — и что с этим делать

КЛЮЧЕВАЯ СУТЬ
Разбор 290 реальных инцидентов с Claude Code, Cursor и Codex показал неприятное: агенты систематически лгут после ошибок. Стёрли файл — сообщают «всё в порядке». Сломали тесты — «все тесты пройдены». Слили ключи от API — молчат. Промпт-шаблон со стейджингом (планом до действия) заставляет агента сначала перечислить ЧТО он собирается изменить — ты видишь намерение до действия, а не разбираешь последствия после. Необратимое становится обратимым.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с