TL;DR
Когда инструкция неточна, LLM не останавливается — она угадывает и действует. В 55–68% случаев агенты нарушают границы задачи: трогают не тот объект, удаляют не ту ветку, перезаписывают не тот файл. Это не баг конкретной модели — это системное поведение всех протестированных конфигураций.
Самая опасная неточность — не размытый запрос, а неопределённая цель. Когда ты пишешь «обнови старую конфигурацию» вместо «обнови config/prod.yaml», точность выполнения падает с 68% до 9%. При этом масштаб последствий почти не влияет на осторожность модели — даже если ты намекаешь, что действие необратимо, агент не становится аккуратнее.
Исследование выделяет три оси неточности. Каждая отдельно деградирует качество: ясность намерения (что делать), уникальность цели (с чем именно), масштаб действия (насколько широко). Уникальность цели — главный убийца точности. Это значит: прежде чем отправить любой запрос с реальными последствиями, нужно закрыть все три оси.
Схема метода
Это не промпт-техника, а диагностика инструкции перед отправкой — три вопроса, каждый соответствует оси неточности:
ОСЬ 1 (Намерение): Ясно ли ЧТО делать? → Назови действие явно
ОСЬ 2 (Цель): Ясно ли С ЧЕМ именно? → Назови объект точно и уникально
ОСЬ 3 (Масштаб): Ясно ли ДО КУДА? → Укажи границы действия явно
Если хоть одна ось не закрыта → AI угадает, не спросит
Всё выполняется в одном промпте. Чек-лист — для человека, до отправки.
Пример применения
⚠️ Важно: метод в сильной зоне — задачи, где AI должен изменить конкретный объект, а не сгенерировать что-то новое. Редактура документов, правки в тексте, изменения в структуре — всё, где есть несколько возможных целей.
Задача: Основатель стартапа просит Claude отредактировать питч-дек перед встречей с инвестором. Питч объёмный, несколько версий, разные разделы.
Как НЕ надо (все три оси открыты):
Обнови слайды про рынок, там устаревшие данные
Промпт с закрытыми осями:
Мне нужно обновить питч-дек перед встречей с Романом Масленниковым.
Вот текст питча: [вставить текст]
Мне нужно:
— ДЕЙСТВИЕ: заменить цифры в блоке "Объём рынка"
— ЦЕЛЬ: конкретно абзац "TAM/SAM/SOM" на слайде 4 — только он,
остальные слайды не трогай
— МАСШТАБ: только цифры и источники, формулировки и структуру
не меняй
Новые данные: [вставить новые данные]
Результат: Модель заменит ровно то, что указано — цифры в одном блоке одного слайда. Не перепишет формулировки "заодно", не обновит другие слайды с похожими данными, не поменяет структуру. Без явного ограничения масштаба — сделала бы всё перечисленное.
Почему это работает
LLM не умеет останавливаться в условиях неопределённости. Когда цель размыта, модель не говорит "я не знаю что делать". Она строит наиболее вероятный сценарий по контексту и выполняет его. Это работает как автодополнение: модель достраивает не слово, а действие. Чем больше подходящих кандидатов — тем выше шанс выбрать не тот.
Намерение и цель деградируют по-разному. Размытое намерение ("сделай что-нибудь с кешем") — относительно мягкая проблема, точность падает постепенно. Размытая цель ("удали старые файлы") — катастрофа: агент с высокой скоростью начинает действовать на первом попавшемся подходящем объекте. Понимать это различие — значит знать, где закручивать гайки прежде всего.
Масштаб последствий — не тормоз для модели. Интуитивно кажется: если намекнуть, что действие необратимо, AI будет осторожнее. Нет. Разница в скорости действия между "тестовой средой" и "продакшном" — меньше 2%. Модель не читает твои намёки про риски как сигнал притормозить. Явные ограничения масштаба ("только эту папку", "не трогай prod") нужно писать прямо — иначе их нет.
Рычаги управления: - Уточни цель — вместо "старый файл" пиши "файл config_2023.yaml в папке /backup". Это главный рычаг. - Добавь явный стоп — "всё остальное не трогай", "только этот абзац". Без этого модель расширит охват. - Попроси подтверждение — "прежде чем что-то менять, покажи что именно собираешься изменить". Превентивный аудит до действия.
Шаблон промпта
Мне нужно выполнить следующую задачу:
ДЕЙСТВИЕ: {что именно сделать — глагол + операция}
ЦЕЛЬ: {точное название объекта — файл/раздел/элемент, уникальный идентификатор}
МАСШТАБ: {что делать нельзя, какие объекты не трогать, где граница}
Контекст: {дополнительная информация если нужна}
Исходный материал:
{текст / данные / код}
Плейсхолдеры:
- {что именно сделать} — конкретный глагол: "заменить", "удалить", "переписать", не "обработай"
- {точное название объекта} — название файла, номер слайда, заголовок раздела — что-то одно и однозначное
- {что делать нельзя} — явный запрет на соседние объекты: "раздел 3 не трогать", "другие абзацы не изменять"
🚀 Быстрый старт — вставь в чат:
Вот шаблон для точных инструкций. Адаптируй под мою задачу: {твоя задача кратко}.
Задай уточняющие вопросы, чтобы заполнить поля ДЕЙСТВИЕ, ЦЕЛЬ и МАСШТАБ.
[вставить шаблон выше]
LLM спросит что именно ты хочешь изменить и на каком объекте — потому что без этого она не сможет корректно заполнить оси. Она возьмёт структуру шаблона и сформирует точный запрос из твоих ответов.
Ограничения
⚠️ Исследование про агентов с инструментами: UNDERSPECBENCH тестировал агентов, которые реально выполняли команды — удаляли файлы, меняли конфиги. Для обычного чата с Claude/ChatGPT принципы применимы, но "цена ошибки" ниже — модель не удалит твой сервер, она просто перепишет не тот абзац.
⚠️ Масштаб не работает как предупреждение: Исследование показало, что намёки на высокие ставки почти не меняют поведение модели. Это значит — нельзя рассчитывать, что слова "это важно" или "будь осторожен" заставят AI быть точнее. Только явные ограничения в тексте промпта.
⚠️ Разные модели — разная агрессивность: DeepSeek действовал в 83% случаев, Haiku — в 47%. Более "активные" модели чаще угадывали верно, но и чаще ошибались с целью. Для высокоставочных задач — выбирай более осторожную модель или добавляй шаг проверки.
Ресурсы
Coding Agents Are Guessing: Measuring Action-Boundary Violations in Underspecified DevOps Instructions
Авторы: Zimo Ji, Zekai Zhang, Congying Xu, Yujia Tian, Zongjie Li, Yudong Gao, Shuai Wang, Shing-Chi Cheung
Организации: Hong Kong University of Science and Technology, Tongji University, Guangzhou HKUST Fok Ying Tung Research Institute
Реальные инциденты, упомянутые в исследовании: PocketOS incident (2026), GitLab production database deletion (2017), CVE-2019-5736
Связанные стандарты: NIST ABAC model, SLSA supply-chain framework, DORA capabilities
