3,583 papers
arXiv:2606.05391 74 3 июня 2026 г. FREE

Четыре фазы надзора за AI-агентом: как не потерять контроль над многошаговыми задачами

КЛЮЧЕВАЯ СУТЬ
Большинство пользователей работают с AI реактивно — дали задачу, ждут результат, потом разбираются с последствиями. Исследователи опросили 17 профессиональных разработчиков, которые ежедневно используют AI-агентов (Claude Code, Cursor, Cline), и обнаружили: опытные пользователи контролируют AI на четырёх отдельных уровнях, не одном. И самый важный из них происходит ещё до того, как задача начата.
Адаптировать под запрос

TL;DR

Большинство пользователей работают с AI реактивно — дали задачу, ждут результат, потом разбираются с последствиями. Исследователи опросили 17 профессиональных разработчиков, которые ежедневно используют AI-агентов (Claude Code, Cursor, Cline), и обнаружили: опытные пользователи контролируют AI на четырёх отдельных уровнях, не одном. И самый важный из них происходит ещё до того, как задача начата.

Главная находка: AI-агент — не поисковик, которому задаёшь запрос и смотришь результат. Без явных ограничений модель "уходит в свои дела" и делает не то, что нужно. Но проблема не в том, что AI плохо работает — проблема в том, что большинство пользователей пропускают профилактический контроль и пытаются починить ошибку только после того, как она уже случилась. Это как давать подрядчику ключи от квартиры без ТЗ, а потом удивляться ремонту.

Исследование описывает четыре фазы надзора: (1) настройка до начала задачи — жёсткие границы и контекст; (2) совместное планирование — агент объясняет план перед действием; (3) наблюдение в процессе — промежуточные проверки; (4) итоговая проверка — но умная, через суррогатные критерии, а не ручной просмотр каждой строки.


🔬

Схема метода

ФАЗА 1: A priori control — до задачи
        Задай ограничения + глобальный контекст + запреты
        → Один раз создаётся, постоянно дополняется

ФАЗА 2: Co-planning — перед запуском
        Попроси агента описать план ДО исполнения
        → Отдельный запрос: "Сначала объясни, как будешь решать"

ФАЗА 3: Real-time monitoring — во время
        Контрольные точки на ключевых этапах
        → Промежуточные запросы: "Что сделал, что осталось, есть ли блокеры?"

ФАЗА 4: Post hoc review — после
        Проверка через суррогатные критерии (не ручной аудит)
        → "Этот результат проходит тест X?" вместо "прочитай всё подряд"

Фазы 2–4 требуют отдельных сообщений. Фаза 1 — разовая настройка, которую ты пополняешь со временем.


🚀

Пример применения

Задача: Ты запускаешь небольшой онлайн-курс и просишь Claude написать полную программу — 8 модулей с темами, домашними заданиями и описаниями уроков. Обычно даёшь задачу одним сообщением и смотришь что получится.

Промпт (Фаза 1 — твой "проектный бриф", создаётся один раз):

## Контекст проекта
Я создаю онлайн-курс по {теме} для {целевая_аудитория}.
Формат платформы: {Геткурс / Тильда / другое}.
Ограничения:
— Не предлагать форматы "живых вебинаров" — курс асинхронный
— Не включать модули длиннее 45 минут
— Домашние задания — только практические, без эссе
— Тон материала: {профессиональный / дружелюбный / строгий}

Аудитория уже знает: {что знает}
Аудитория не знает: {чего не знает}

Цель курса: {результат который получит студент}

Промпт (Фаза 2 — совместное планирование):

Прежде чем писать программу курса — опиши свой план:
- Какую структуру модулей предлагаешь и почему
- Как будешь распределять сложность от модуля к модулю
- Какие допущения делаешь о моей аудитории

Жду план. После моего одобрения — приступай к написанию.

Результат: В первом ответе модель покажет структурный план — логику разбивки на модули, принцип нарастания сложности, свои допущения об аудитории. Ты увидишь направление до того, как написан первый модуль. Если что-то не так — правишь сейчас, не выбрасываешь готовый материал.


🧠

Почему это работает

Почему не работает "в лоб": AI генерирует текст, исходя из самого вероятного продолжения твоего запроса. Без явных ограничений модель заполняет пробелы своими предположениями — и они часто не совпадают с твоими. Чем длиннее задача, тем дальше уходит результат от того, что ты имел в виду.

Что модель умеет хорошо: Следовать явным инструкциям. Если ограничения и контекст прописаны заранее, модель встраивает их в каждый шаг. Проектный бриф — это не мета-комментарий, это активная часть промпта.

Как метод использует это: Четыре фазы распределяют контроль во времени. Фаза 1 убирает нежелательные направления ещё до старта. Фаза 2 делает план видимым — ты одобряешь логику, а не угадываешь её по готовому тексту. Фазы 3–4 ловят ошибки до того, как они накопились.

Рычаги управления: - Детальность проектного брифа → чем конкретнее запреты, тем меньше нежелательных сюрпризов - Момент совместного планирования → для простых задач можно пропустить; для сложных — обязательно - Суррогатные критерии в фазе 4 → вместо "прочитай всё" задай конкретный тест: "Каждый модуль содержит практическое задание? Да/Нет по каждому"


📋

Шаблон промпта

## Проектный бриф: {название_проекта}

### Контекст
{Что это за проект. 2-3 предложения.}

### Аудитория
Знает: {что уже знает аудитория}
Не знает: {что для неё ново}

### Жёсткие ограничения (не нарушать)
— {Ограничение 1}
— {Ограничение 2}
— {Ограничение 3}

### Тон и формат
{Стиль, объём, платформа, формат вывода}

### Цель
{Что получит пользователь на выходе. Один конкретный результат.}

---

Прежде чем начать — опиши свой план решения задачи.
Жду план. Приступай только после моего подтверждения.

Задача: {конкретная_задача}

Плейсхолдеры: - {название_проекта} — чтобы легко найти бриф позже - {что знает / не знает аудитория} — ключевые ограничения на уровень и язык материала - {Ограничение 1-3} — конкретные запреты: форматы, темы, подходы которые не нужны - {конкретная_задача} — сама задача, отдельно от контекста


🚀 Быстрый старт — вставь в чат:

Вот шаблон проектного брифа для работы с AI. 
Адаптируй под мою задачу: {твоя задача}. 
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит об аудитории, ограничениях и формате — потому что без этих данных не сможет правильно заполнить бриф. Она возьмёт структуру шаблона и соберёт твой персональный проектный бриф через диалог.


⚠️

Ограничения

⚠️ Фокус на разработчиках: Исследование проводилось с профессиональными разработчиками, использующими code-агентов. Перенос принципов на другие задачи требует адаптации — не все четыре фазы одинаково важны для, например, написания текстов или аналитики.

⚠️ "Хорошего достаточно": Опытные пользователи намеренно выбирают эффективный, а не идеальный надзор. Исследование честно говорит: полноценная проверка каждого шага AI невозможна на практике. Четыре фазы не гарантируют нулевых ошибок — они снижают их количество и делают ошибки поймаемыми раньше.

⚠️ Бумага доступна частично: В предоставленном тексте детально описана только фаза 1 (a priori control). Фазы co-planning, real-time monitoring и post hoc review, а также полный раздел про эвристики — упомянуты в абстракте, но не приведены полностью. Описание фаз 2–4 выше восстановлено из структуры исследования.

⚠️ Не для одноразовых запросов: Метод работает для сложных, многошаговых задач. Если тебе нужен быстрый ответ на простой вопрос — четыре фазы избыточны.


🔗

Ресурсы

Human oversight of agentic systems in practice: Examining the oversight work, challenges, and heuristics of developers using software agents

Shipi Dhanorkar, Samir Passi, Mihaela Vorvoreanu — Microsoft, США, 2025

Смежные инструменты упомянутые в исследовании: Claude Code, Cursor, Cline, GitHub Copilot, OpenHands CodeAct


Проблемы LLM

ПроблемаСутьКак обойти
Ошибка направления видна только после выполненияДаёшь сложную задачу. Модель начинает работу. Где-то на втором шаге берёт неверное допущение — и строит всё дальше на нём. Ты видишь это только в готовом результате. Переделывать приходится с середины, а не с одного слова в начале. Чем длиннее задача — тем дороже исправлениеПопроси модель описать план ДО начала работы — отдельным сообщением. Смотришь направление, не результат. Ошибку в плане исправить — секунда

Методы

МетодСуть
Совместное планирование — одобряй логику, не результатПеред сложной задачей пиши отдельный запрос: Опиши свой план решения. Какую структуру выберешь и почему. Какие допущения делаешь. Жду план — приступай только после моего подтверждения. Модель покажет логику до того, как напишет первую строку. Ты одобряешь направление, а не угадываешь его по готовому тексту. Почему работает: модель хорошо следует явным инструкциям. Если видишь план до старта — проблему можно назвать словами. После старта — только выбросить и переделать. Когда применять: задача из нескольких шагов, высокая цена переделки. Когда пропустить: простой одношаговый запрос
Суррогатный критерий вместо ручного аудитаВместо "прочитай всё и проверь" задай конкретный да/нет вопрос как тест: Каждый раздел содержит практическое задание? Ответь Да/Нет по каждому разделу. Или: Есть ли хоть один пункт длиннее 45 минут? Перечисли. Модель проверяет свой результат по точному критерию. Почему работает: общий вопрос "всё правильно?" даёт общий ответ "да". Конкретный критерий вынуждает проверить каждый элемент отдельно. Когда применять: большой результат, есть чёткий формальный признак качества

Тезисы

ТезисКомментарий
Без явных ограничений модель заполняет пробелы своими предположениямиВ запросе есть пустые места — тема не уточнена, формат не задан, ограничения не названы. Модель не останавливается. Она выбирает самое вероятное продолжение и строит на нём. Её выбор часто не совпадает с твоим. Чем длиннее задача — тем дальше уходит результат. Применяй: пиши явные запреты, а не только цель. Не "напиши программу курса", а "напиши программу курса — без живых вебинаров, без модулей длиннее 45 минут, без эссе в домашних заданиях"
📖 Простыми словами

Human oversight ofagenticsystems in practice: Examining the oversight work, challenges, and heuristics of developersusingsoftwareagents

arXiv: 2606.05391

Суть в том, что работа с AI-агентами — это не просто «закинул задачу и жди магию», а полноценный менеджмент капризного, но очень быстрого сотрудника. Большинство юзеров застревают на реактивном контроле: смотрят на готовый результат и пытаются понять, где нейронка накосячила. Исследование показывает, что профи работают иначе — они дробят контроль на четыре уровня, где самый важный этап наступает еще до нажатия кнопки Enter. Если ты не задал рамки на старте, агент превращается в неуправляемую ракету, которая летит быстро, но не туда.

Это как нанять строителей и уехать в отпуск, оставив им ключи и записку «сделайте красиво». Формально работа будет сделана, но по возвращении ты обнаружишь унитаз посреди гостиной, потому что рабочие так «увидели» пространство. Опытные разработчики ведут себя как дотошные прорабы: они не просто проверяют цвет стен в конце, а контролируют каждый этап — от выбора материалов до того, как именно рабочие поняли чертеж. Без этого превентивного надзора любая сложная задача превращается в лотерею с отрицательным матожиданием.

В реальности работают четыре конкретных фильтра: планирование контекста (что агенту можно трогать, а что нет), верификация плана (пусть сначала расскажет, как собирается решать задачу), мониторинг процесса (смотреть за руками в реальном времени) и финальная приемка. Разработчики используют эвристики доверия: если агент начал с уверенного, но неверного шага, его стопают сразу, не дожидаясь финала. Цифры показывают, что 80% успеха зависят от того, насколько жестко ты ограничил «пространство маневра» модели в самом начале, используя инструменты вроде Claude Code или Cursor.

Хотя исследование проводили на программистах, этот принцип — универсальный паттерн для любого взаимодействия с AI. Будь то сборка онлайн-курса, написание юридического договора или создание маркетинговой стратегии, логика одна: агент лажает там, где ты оставил пустоту в инструкциях. Модель всегда заполняет пробелы наиболее вероятным мусором, поэтому контроль должен сместиться с проверки результата на проектирование процесса. Это переход от роли «заказчика текста» к роли «архитектора системы», где ты управляешь не словами, а логикой выполнения.

Короче: если ты просто ждешь результат от агента, ты уже проиграл. Чтобы AI не превратил твой проект в кучу цифрового хлама, нужно внедрять многоуровневый надзор и проверять промежуточные планы так же строго, как и готовый код. Либо ты тратишь время на контроль в начале, либо тратишь в десять раз больше на разгребание последствий в конце. Реактивный подход мертв, будущее за теми, кто умеет направлять агентов за руку, не давая им уйти в самодеятельность.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с