3,583 papers
arXiv:2605.19362 75 19 мая 2026 г. FREE

Принцип четырёх якорей: чеклист для промптов, которые дают предсказуемый результат

КЛЮЧЕВАЯ СУТЬ
878 инструкций для ИИ-агентов проверили на полноту — и нашли: пример хорошего результата присутствовал только в каждом пятом запросе. При том что именно он — самый мощный элемент из четырёх возможных. Метод четырёх якорей позволяет с первого раза получать предсказуемый результат без трёх итераций и правок. Большинство описывают что ДАЮТ модели — данные, контекст — но забывают сказать что ХОТЯТ получить, что за рамками задачи, и как выглядит хороший вывод конкретно. Каждый якорь закрывает один из этих пробелов.
Адаптировать под запрос

TL;DR

Исследователи проверили 878 инструкций для ИИ-агентов и нашли системную проблему: большинство запросов к ИИ неполные. Не в смысле "забыл уточнить детали", а в смысле отсутствия конкретных элементов, без которых ИИ не может дать проверяемый результат. Из этого вытекает четырёхэлементный чеклист — четыре якоря — которые делают любой промпт полным.

Главная находка: почти все пишут что дают модели (входные данные, контекст), но забывают описать что хотят получить, что выходит за рамки задачи, и — реже всего — как выглядит хороший результат конкретно. Пример присутствовал лишь в каждом пятом запросе. Без примера человек вынужден перебирать итерации вместо того, чтобы с первого раза получить нужное — потому что у модели нет точки отсчёта для "правильно".

Как это решает метод: чеклист из четырёх якорей — операционная база, контракт на вывод, граница задачи, пример результата — даёт структуру для любого промпта. Каждый якорь отвечает на конкретный вопрос: что я даю, что хочу получить, что НЕ нужно делать, и вот как это выглядит в хорошем случае.


🔬

Схема метода

Все четыре якоря — в одном промпте:

ЯОрь 1: Операционная база → что ты даёшь модели (данные, контекст, ограничения среды)
Якорь 2: Контракт на вывод → какой формат и тип результата ожидаешь
Якорь 3: Граница задачи → что НЕ нужно включать, что за рамками
Якорь 4: Пример результата → конкретный образец "хорошего" вывода

Один запрос. Четыре блока. Если хотя бы один отсутствует — результат непредсказуем.


🚀

Пример применения

Задача: Ты — операционный директор небольшой логистической компании в Екатеринбурге. Нужно попросить Claude написать регламент для водителей по работе с претензиями клиентов. Раньше давал просто: "напиши регламент про претензии" — получал что-то среднее, приходилось переделывать три раза.

Промпт:

Я дам тебе задачу и опишу все четыре якоря.

ОПЕРАЦИОННАЯ БАЗА:
У меня небольшая транспортная компания (14 водителей-экспедиторов). 
Основные клиенты — магазины и склады. Претензии бывают трёх типов: 
недостача, повреждение груза, опоздание. Водители не любят документировать, 
избегают конфликтов, часто обещают клиенту то, что не могут выполнить.

КОНТРАКТ НА ВЫВОД:
Нужен пошаговый регламент. Формат: нумерованный список действий. 
Для каждого шага — одно действие, одно предложение. 
Итоговый объём — не больше одной страницы А4.

ГРАНИЦА ЗАДАЧИ:
Не нужны разделы про общую культуру обслуживания, историю компании, 
ценности бренда. Только конкретные действия при претензии — от момента 
когда клиент говорит "у меня проблема" до закрытия ситуации.

ПРИМЕР ХОРОШЕГО ШАГА:
"Шаг 3. Сфотографируй повреждение при клиенте и сразу отправь фото 
в общий чат диспетчеров."

Результат: Модель выдаст конкретный пронумерованный регламент в точном формате. Каждый шаг — одно действие, без воды. Объём будет в пределах одной страницы. Никаких абзацев про корпоративную культуру. Первый вариант будет готов к использованию или потребует минимальной правки — потому что у модели был точный образец того, как выглядит хороший шаг.


🧠

Почему это работает

Слабость LLM: модель генерирует текст, опираясь на паттерны обучения. Когда запрос расплывчатый, она заполняет неопределённость "средним типичным" ответом из своих паттернов. "Напиши регламент" → модель пишет то, что регламенты обычно содержат. Не то, что нужно тебе.

Сильная сторона LLM: модель отлично следует конкретным структурным ограничениям. Если ты задаёшь формат вывода, ограничения и образец — она придерживается их точно. Это не творчество, это точное следование шаблону, которое и нужно для предсказуемого результата.

Как метод использует это: четыре якоря убирают неопределённость по каждому измерению. Операционная база — убирает догадки про контекст. Контракт на вывод — убирает догадки про формат. Граница задачи — убирает лишнее, которое модель могла бы добавить "по умолчанию". Пример — даёт точечный паттерн для калибровки тона, детальности, стиля. Каждый якорь сужает пространство возможных ответов.

Рычаги управления: - Пример результата — самый мощный якорь. Один конкретный образец даёт больше, чем три абзаца описания - Граница задачи — особенно важна для длинных задач. Без неё модель "разрастается" в стороны - Контракт на вывод — если нужна итерация, убери его и спроси "а как бы ты это оформил?" — потом зафиксируй понравившийся формат якорем


📋

Шаблон промпта

ОПЕРАЦИОННАЯ БАЗА:
{Что ты даёшь модели: данные, контекст, кто аудитория, 
какие условия, что уже есть}

КОНТРАКТ НА ВЫВОД:
{Что хочешь получить: формат, структура, объём, 
тип документа или текста}

ГРАНИЦА ЗАДАЧИ:
{Что НЕ нужно: какие разделы пропустить, 
что за рамками, чего нет в условии}

ПРИМЕР ХОРОШЕГО РЕЗУЛЬТАТА:
{Один конкретный фрагмент того, как должен выглядеть 
хороший вывод — одна строка, один шаг, один абзац}

ЗАДАЧА:
{Сформулируй что нужно сделать}

Что подставлять: - {Операционная база} — всё что у тебя есть: текст, цифры, контекст, аудитория, платформа - {Контракт на вывод} — формат (список, таблица, текст), объём (предложения, абзацы, страницы), тон - {Граница задачи} — буквально: "не нужно", "пропусти", "без" - {Пример} — напиши один пример шага/абзаца/строки так, как тебе нравится


🚀 Быстрый старт — вставь в чат:

Помоги мне заполнить шаблон четырёх якорей для моей задачи: {твоя задача}.
Задай вопросы, чтобы заполнить каждый якорь.

[вставить шаблон выше]

LLM спросит тебя про формат вывода, примеры и ограничения — потому что именно эти якоря чаще всего пропускают, и без них модель не может сделать промпт полным.


⚠️

Ограничения

⚠️ Субъективные задачи: Якоря работают хуже там, где нет одного правильного ответа — "напиши стихотворение", "придумай слоган". Пример результата здесь скорее ограничивает креатив, чем помогает.

⚠️ Короткие разовые запросы: Для простого вопроса ("переведи это слово") четыре якоря — избыточны. Метод даёт максимум на сложных задачах с конкретными требованиями к результату.

⚠️ Пример ≠ гарантия: Наличие якоря "пример результата" не означает что модель выдаст точно такое же. Это калибровка, не копирование. Очень специфические форматы может потребоваться уточнять итерационно.


🔍

Как исследовали

Исследователь из Университета Вашингтона взял 878 файлов SKILL.md — это инструкции для ИИ-агентов Claude из публичных GitHub-репозиториев по кибербезопасности. Идея была простой: проверить не "безопасен ли этот агент?", а "может ли человек понять что агент делает, прежде чем запустить его?". Для этого разработали четыре текстовых паттерна — якоря — и автоматически проверяли каждый файл на их наличие.

Результаты оказались показательными: операционная база (что подаётся на вход) есть почти везде — 92%. А вот конкретный пример результата — только в 19% случаев. Все четыре якоря одновременно — лишь в 2,3%. Это означает что авторы НЕ думают о документации как о средстве помочь пользователю сформировать ожидания — они думают о ней как об инструкции для машины.

Дополнительно исследователь взял 6 навыков по обнаружению DNS-туннелирования и попробовал реально запустить их с синтетическими данными. Единственный навык с конкретным примером вывода (JSON с полями) позволил сразу понять что делать и что ожидать. Остальные пяти пришлось "лазить" в исходный код, чтобы понять какие аргументы передавать и что придёт в ответе. Пример экономил не просто время — он делал задачу вообще выполнимой без технической экспертизы.


💡

Адаптации и экстраполяции

📌

🔧 Техника: "обратный якорь" — попроси модель заполнить пример за тебя

Если не знаешь как сформулировать пример результата — спроси модель:

"Прежде чем выполнить задачу, покажи мне один пример того, как ты планируешь оформить ответ. Я скажу подходит ли формат."

Это "калибровочный шаг" перед основным запросом. Ты получаешь черновик формата → корректируешь → даёшь как якорь.

📌

🔧 Техника: якорь-граница как фильтр галлюцинаций

Якорь "граница задачи" особенно эффективен когда модель склонна дополнять факты от себя:

ГРАНИЦА ЗАДАЧИ:
Используй только информацию из текста ниже. 
Если данных нет — напиши "нет данных" вместо предположения.
Не добавляй общие факты из своих знаний.

Это не просто "не галлюцинируй" — это конкретная инструкция что делать в каждом случае неопределённости.


🔗

Ресурсы

Toward User Comprehension Supports for LLM Agent Skill Specifications Zikai Alex Wen — University of Washington, Tacoma School of Engineering & Technology Материалы и скрипты: https://github.com/zikaiwen/cyber-skill-comprehension


📋 Дайджест исследования

Ключевая суть

878 инструкций для ИИ-агентов проверили на полноту — и нашли: пример хорошего результата присутствовал только в каждом пятом запросе. При том что именно он — самый мощный элемент из четырёх возможных. Метод четырёх якорей позволяет с первого раза получать предсказуемый результат без трёх итераций и правок. Большинство описывают что ДАЮТ модели — данные, контекст — но забывают сказать что ХОТЯТ получить, что за рамками задачи, и как выглядит хороший вывод конкретно. Каждый якорь закрывает один из этих пробелов.

Принцип работы

Четыре блока в одном промпте: 1. Операционная база — что даёшь (данные, контекст, аудитория, ограничения) 2. Контракт на вывод — что хочешь получить (формат, объём, структура) 3. Граница задачи — что не нужно включать 4. Пример результата — один конкретный образец хорошего вывода Каждый якорь убирает одно измерение неопределённости. Если хотя бы один пропущен — модель заполняет пробел тем, что регламенты, отчёты или списки «обычно содержат» по её паттернам. Не тем, что нужно тебе.

Почему работает

Модель генерирует текст опираясь на паттерны обучения. Расплывчатый запрос — получаешь «средний типичный» ответ по всем похожим текстам которые она видела. «Напиши регламент» → пишет то, что регламенты обычно содержат. Якоря сужают пространство возможных ответов по каждой оси сразу. Пример результата — самый острый инструмент из четырёх: один конкретный образец шага или абзаца передаёт модели больше про нужный тон, детализацию и формат, чем три абзаца описания. Именно поэтому его отсутствие в 80% промптов — не мелочь, а главная причина итераций в никуда.

Когда применять

Сложные структурные задачи → регламенты, технические задания, шаблоны документов, инструкции, отчёты — особенно когда нужен конкретный формат и важно попасть с первого раза. Максимально полезен, когда у тебя есть чёткое представление о том, как должен выглядеть хороший результат, но ты раньше не мог это передать модели. НЕ подходит для: коротких разовых вопросов («переведи слово», «что такое X») и открытых творческих задач — там пример результата скорее ограничит, чем поможет.

Мини-рецепт

1. Опиши что у тебя есть: данные, контекст, кто аудитория, платформа, условия — всё что есть на входе
2. Зафиксируй формат вывода: список или таблица или текст, объём в абзацах или страницах, тон
3. Отсеки лишнее: буквально напиши «не нужно», «пропусти», «без этих разделов» — без этого модель разрастается в стороны
4. Напиши один пример: один шаг, один абзац, одна строка — именно так как тебе нравится; это самый мощный якорь из четырёх
5. Поставь задачу: в конце одним предложением скажи что нужно сделать

Если не знаешь с чего начать — попроси модель помочь заполнить якоря: Помоги заполнить четыре якоря для задачи: {твоя задача}. Задай вопросы для каждого блока: операционная база, формат вывода, что не нужно, пример результата.

Примеры

[ПЛОХО] : Напиши регламент по работе с претензиями для водителей
[ХОРОШО] : ОПЕРАЦИОННАЯ БАЗА: 14 водителей-экспедиторов, клиенты — склады и магазины, три типа претензий: недостача, повреждение груза, опоздание. Водители избегают конфликтов и часто обещают клиентам то, что не могут выполнить. КОНТРАКТ НА ВЫВОД: нумерованный список, одно конкретное действие на шаг, не больше одной страницы А4. ГРАНИЦА ЗАДАЧИ: без истории компании, корпоративных ценностей и общей культуры обслуживания — только шаги от момента «у меня проблема» до закрытия претензии. ПРИМЕР ХОРОШЕГО ШАГА: «Шаг 3. Сфотографируй повреждение при клиенте и отправь фото в чат диспетчеров.» ЗАДАЧА: напиши пошаговый регламент для водителей-экспедиторов. Результат первого варианта будет готов к использованию — или потребует минимальной правки. Потому что у модели был точный образец того, как выглядит хороший шаг.
Источник: Toward User Comprehension Supports for LLM Agent Skill Specifications
ArXiv ID: 2605.19362 | Сгенерировано: 2026-05-20 06:32

Проблемы LLM

ПроблемаСутьКак обойти
Без границ задачи модель добавляет лишнее по умолчаниюНе написал "это не нужно" — модель включит. Раздел про историю компании, вводный абзац, заключение с выводами. Добавляет не потому что нужно, а потому что это типичный паттерн для таких текстов. Чем длиннее задача — тем больше нежелательных блоковДобавь отдельный блок с явными запретами. Буквально: "не нужно", "пропусти", "без раздела X". Одна строка на каждый запрет
Без примера модель калибруется на "типичный" выводОписываешь что хочешь получить. Модель читает. Заполняет неопределённость паттернами из обучения — как обычно выглядят такие тексты. Получаешь среднее по больнице. Эмпирически: примеры есть лишь в каждом пятом запросе — при том что это самый мощный инструмент калибровкиДай один конкретный образец. Один шаг. Один абзац. Одна строка в нужном тоне. Не описание того как должно быть — а сам фрагмент

Методы

МетодСуть
Четыре якоря — полный запрос без итерацийСтруктура из четырёх обязательных блоков. 1. Операционная база — что ты даёшь: данные, контекст, аудитория. 2. Контракт на вывод — что хочешь получить: формат, объём, структура. 3. Граница задачи — что НЕ нужно: какие блоки пропустить, что за рамками. 4. Пример результата — один конкретный образец хорошего фрагмента. Пример синтаксиса: ОПЕРАЦИОННАЯ БАЗА: ... КОНТРАКТ НА ВЫВОД: ... ГРАНИЦА ЗАДАЧИ: ... ПРИМЕР: .... Каждый якорь закрывает одно измерение неопределённости. Убираешь один — модель заполняет это место паттерном по умолчанию. Работает: сложные задачи с конкретными требованиями к результату. Не работает: простые вопросы, творческие задачи без критерия правильности

Тезисы

ТезисКомментарий
Один пример даёт больше чем три абзаца описанияОписание задаёт направление. Пример задаёт точку. Модель калибрует тон, детальность, стиль — по образцу точнее чем по словесному описанию. Механика: пример — это конкретный паттерн, описание — абстракция над паттернами. Применяй: перед финальным запросом напиши один фрагмент так, как ты хочешь видеть результат. Покажи его модели как образец
📖 Простыми словами

Toward User Comprehension Supports forLLMAgentSkill Specifications

arXiv: 2605.19362

Проблема в том, что мы общаемся с нейросетями как с телепатами, а они на самом деле — исполнительные, но абсолютно буквальные стажеры. Исследователи прогнали через фильтры почти 900 инструкций для ИИ-агентов и выяснили печальный факт: большинство запросов — это пустышки. В них нет фундаментальных зацепок, которые позволяют модели выдать не просто «какой-то текст», а проверяемый результат. Когда ты даешь размытую задачу, LLM не уточняет детали, она просто заполняет пустоту среднестатистическим мусором из своей базы данных.

Это как заказать в ресторане «что-нибудь вкусное» и искренне возмутиться, когда принесут жареную саранчу. Формально — это еда, фактически — ты это есть не будешь. Без четких границ модель включает режим генерации галлюцинаций, пытаясь угадать твои скрытые желания, и в 9 из 10 случаев промахивается. Чтобы этого не происходило, любому промпту нужны четыре якоря, которые намертво привязывают фантазию ИИ к реальности.

Вместо того чтобы просить «написать регламент», нужно внедрить конкретику: роль (кто говорит), контекст (где происходит действие), задача (что именно сделать) и, самое важное, критерии успеха (как понять, что результат не херня). Например, если ты логист из Екатеринбурга, не жди чуда от фразы «напиши правила для водителей». Тебе нужно четко прописать: «Ты — операционный директор, пишем инструкцию по работе с претензиями, чтобы водитель не хамил, а фиксировал ущерб на фото». Только так Claude или GPT перестанут лить воду и выдадут рабочий инструмент.

Этот принцип универсален и работает везде: от написания кода до составления плана тренировок. Исследование доказывает, что полнота инструкции — это не про количество слов, а про наличие этих четырех элементов. Если выкинуть хотя бы один, модель начнет лажать. Это переход от шаманства с промптами к инженерному подходу: ты не надеешься на удачу, а строишь каркас, внутри которого ИИ просто не может выдать плохой результат.

Короче: хватит играть в угадайку и надеяться на «ум» модели. Если результат тебя бесит, значит, ты оставил слишком много места для интерпретации. Используй чеклист из четырех якорей для каждой важной задачи, и ты увидишь, как нейронка превращается из генератора цитат в эффективного сотрудника. Либо ты контролируешь рамки, либо получаешь рандомный бред и тратишь время на бесконечные правки.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с