3,583 papers
arXiv:2606.09421 74 8 июня 2026 г. FREE

Операционные якоря: какие детали нельзя вырезать из системных промптов

КЛЮЧЕВАЯ СУТЬ
Сжал системный промпт — потратил на 14% больше токенов. Не меньше, а больше. Это не случайность: упрощение пошаговых инструкций даёт текст покороче, но токенов на выполнение задачи уходит в 1,14 раза больше оригинала. Метод операционных якорей позволяет резать «воду» из инструкций, не трогая то, что держит модель на курсе. Якорь — конкретная деталь, без которой модель начинает блуждать: переспрашивает, пробует варианты, делает шаги которые не просили. Убрал якорь — модель потратит больше токенов, чем если б промпт остался длиннее.
Адаптировать под запрос

TL;DR

Когда убираешь из системного промпта «лишнее» — есть риск удалить именно то, что держит модель на курсе. Исследование вводит понятие операционных якорей: конкретных деталей (точный синтаксис, формула, порядок проверок), которые занимают мало места, но без которых модель начинает «блуждать» — пробовать варианты, переспрашивать, делать лишние шаги. Результат: итоговых токенов тратится больше, чем если б промпт остался длиннее.

Главная находка — «короче» не значит «лучше» и не значит «дешевле». Конкретный пример из исследования: стратегия «упрощения пошаговых инструкций» сократила сам текст, но увеличила расход токенов при выполнении задачи в 1,14 раза против оригинала. Это парадокс: чем сжатее инструкция о последовательности шагов — тем больше модель отклоняется и потом «восстанавливается».

Метод предлагает не «сжимай всё», а сохраняй нужный тип якоря под тип задачи. Для задач с кодом и инструментами — точный синтаксис и API. Для пошаговых процессов — порядок и условия проверки. Для расчётных задач — формулы, пороги, схемы. Остальное — можно убрать.


🔬

Схема метода

ШАГ 1: Определи тип задачи
  → Код/инструменты? Пошаговый процесс? Правила и расчёты?

ШАГ 2: Выбери стратегию сохранения
  → Код-задачи:        оставь точный синтаксис, импорты, команды
  → Процесс-задачи:   оставь порядок шагов, условия проверки, что делать при ошибке
  → Правило-задачи:   оставь формулы, пороги, схемы, исключения

ШАГ 3: Остальное — сокращай
  → Убирай объяснения «почему», вводные слова, повторы
  → Сохраняй только anchor-детали выбранного типа

Всё выполняется в одном промпте / ревизии системного промпта.

🚀

Пример применения

Задача: Ты ведёшь инвест-канал в Telegram и попросил GPT помочь анализировать компании перед публикацией. Написал подробный системный промпт на 800 слов. Потом решил «почистить» — срезал до 300. Качество разборов упало: модель путает мультипликаторы, игнорирует условия и пишет «в целом хорошая компания».

Промпт (аудит системного промпта):

Я хочу сократить свой системный промпт, но не потерять качество.
Вот мой текущий промпт:

"""
[вставь свой системный промпт]
"""

Моя задача относится к типу: [выбери одно]
— Код или работа с инструментами / API
— Пошаговый процесс с проверками (например: анализ, редактура, аудит)
— Расчёты, правила, формулы, критерии (например: оценка компаний, юридический анализ)

Сделай следующее:
1. Найди операционные якоря — конкретные детали, без которых модель будет угадывать.
   Для моего типа задач это: [формулы/пороги/схемы] / [порядок шагов и условия ошибок] / [точный синтаксис и команды].
2. Отметь, какие части промпта НЕЛЬЗЯ сокращать — это якоря.
3. Отметь, что можно безопасно убрать: вводные фразы, объяснения «почему», повторы.
4. Предложи сокращённую версию с сохранёнными якорями.

Результат: Модель разобьёт промпт на две зоны: «нетрогаемые якоря» и «безопасно убрать». По каждому якорю объяснит, почему именно этот элемент критичен. Выдаст сокращённую версию, в которой убраны объяснения и лирика, но сохранены все конкретные детали, числа, порядок действий.


🧠

Почему это работает

Слабость LLM: модель не хранит намерение между шагами — она работает с тем, что написано сейчас. Если в промпте нет конкретного порога («P/E ниже 15»), модель сгенерит ответ из «общих знаний». Это чаще всего выглядит как расплывчатые формулировки или отклонение от задуманного формата.

Сильная сторона LLM: модель отлично следует явным, конкретным инструкциям — если они прописаны. Точный синтаксис, чёткий порядок шагов, конкретная формула — это не «лишние детали», это навигационные точки. Модель держится за них и не блуждает.

Как метод использует это: вместо «сократи всё» — выбирает, что именно сохранить. Для каждого типа задачи — свой тип якоря. Вся остальная «обёртка» убирается свободно.

Рычаги управления: - Тип задачи → определяет какие якоря приоритетны. Ошибся с типом — сохранишь не то. - Уровень детализации якоря → чем точнее («рентабельность > 20%» вместо «хорошая маржа»), тем меньше модель интерпретирует сама. - Условия ошибки → для пошаговых процессов особенно важны: «если шаг 2 не выполнен — стоп, не переходи к шагу 3». Без них модель «проскакивает» мимо.


📋

Шаблон промпта

Я сокращаю {тип_документа: системный промпт / инструкцию / чеклист}.
Тип задачи: {код_и_инструменты / пошаговый_процесс / правила_и_расчёты}.

Правило сокращения — сохрани операционные якоря:
- Для кода и инструментов: точный синтаксис, команды, порядок импортов, обработка ошибок
- Для процессов: последовательность шагов, условия перехода, что делать при сбое
- Для правил и расчётов: формулы, числовые пороги, схемы, исключения из правил

Всё остальное — объяснения, вводные слова, повторы — убери.

Вот текст для сокращения:
"""
{твой_текст}
"""

Формат ответа:
1. Список якорей, которые сохраняешь — и почему каждый критичен
2. Сокращённая версия текста

Плейсхолдеры: - {тип_документа} — что именно сокращаешь: системный промпт, инструкция для агента, чеклист - {тип_задачи} — выбери один из трёх типов - {твой_текст} — вставь оригинал


🚀 Быстрый старт — вставь в чат:

Вот шаблон аудита промпта. Адаптируй под мою задачу: [опиши что делает твой промпт].
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит: что за текст ты сокращаешь и к какому типу задач он относится — потому что без типа задачи невозможно определить, какие якоря критичны, а что можно смело убрать.


⚠️

Ограничения

⚠️ Нет универсальной стратегии: Один и тот же тип сокращения работает хорошо для одних задач и плохо для других. «Упрощение пошаговых инструкций» стабильно увеличивает количество блужданий модели — даже когда текст становится короче.

⚠️ Требует правильной классификации задачи: Если ошибся с типом задачи — выберешь не те якоря. Например, если задача на самом деле процессная, но ты отнёс её к расчётной — модель получит формулы, но потеряет порядок шагов и начнёт их пропускать.

⚠️ Не работает как разовая чистка: Разные части одного промпта могут требовать разных стратегий. Длинный промпт с кодом и пошаговым процессом — нужно аудировать зонами, а не целиком.


🔗

Ресурсы

Название работы: What Should a Skill Remember? Quality-Cost Trade-offs in Cost-Aware Skill Rewriting for Language Model Agents

Ресурсы: SkillEE на GitHub, бенчмарк SkillsBench

Авторы: Qinghua Xing, Yinda Chen, Bohan Lin (University of Science and Technology of China), Yaping Jin, Zhenhe Wu, Xinghao Chen, Hanting Chen (Huawei Technologies), Hang Zhou (Tianjin University)


📋 Дайджест исследования

Ключевая суть

Сжал системный промпт — потратил на 14% больше токенов. Не меньше, а больше. Это не случайность: упрощение пошаговых инструкций даёт текст покороче, но токенов на выполнение задачи уходит в 1,14 раза больше оригинала. Метод операционных якорей позволяет резать «воду» из инструкций, не трогая то, что держит модель на курсе. Якорь — конкретная деталь, без которой модель начинает блуждать: переспрашивает, пробует варианты, делает шаги которые не просили. Убрал якорь — модель потратит больше токенов, чем если б промпт остался длиннее.

Принцип работы

Разные задачи держатся на разных якорях. Код и инструменты — точный синтаксис, обработка ошибок, порядок команд. Пошаговые процессы — последовательность шагов, условие перехода, что делать при сбое. Правила и расчёты — формулы, числовые пороги, исключения. Всё остальное — объяснения «почему», вводные слова, повторы — убирай без страха. Определи тип своей задачи — и уже ясно, что нетрогаемо. Ошибся с типом — сохранишь не те якоря, и модель всё равно поплывёт.

Почему работает

Модель не хранит намерение между шагами. Она работает с тем, что написано прямо сейчас. Нет числового порога в промпте — возьмёт из «общих знаний», выдаст размытую оценку вместо конкретной. Нет условия перехода — проскочит мимо шага 2 прямо к шагу 3. Якоря — это не детали ради деталей, а навигационные точки. Модель держится за явные конкретные инструкции и не блуждает. Именно поэтому 1,14x токенов при «упрощении» — системный эффект, а не баг конкретного промпта.

Когда применять

Любой агент или ассистент со сложным системным промптом — особенно перед «чисткой» длинных инструкций. Хорошо работает для промптов с пошаговыми процессами, аналитическими схемами, расчётными правилами. Особенно полезно когда модель после оптимизации начала выдавать расплывчатые ответы или игнорировать часть условий. Не подходит для коротких разовых вопрос-ответных промптов без сложной внутренней логики.

Мини-рецепт

1. Определи тип задачи: код и инструменты / пошаговый процесс / правила и расчёты. Это ключевое — промахнёшься с типом, сохранишь не то.
2. Найди якоря своего типа: для процессов — порядок шагов и условия перехода между ними. Для расчётов — числа, формулы, пороги («рентабельность выше 20%», а не «хорошая маржа»). Для кода — конкретный синтаксис, команды, обработка ошибок.
3. Разметь промпт на две зоны: «нетрогаемое» (якоря) и «можно убрать» (вводные фразы, объяснения «почему», повторы, лирика).
4. Режь только вторую зону. После — проверь: все числовые пороги на месте? Порядок шагов цел? Конкретные команды остались?

Если промпт длинный и смешанный (есть и код, и процесс) — аудируй зонами, а не целиком.

Примеры

[ПЛОХО] : Сократи мой системный промпт, он слишком длинный
[ХОРОШО] : Вот мой системный промпт: """ [текст промпта] """ Задача типа «пошаговый процесс» — анализ компаний перед публикацией. Сделай следующее: 1. Найди операционные якоря: порядок шагов, условия переходов, что делать при ошибке или неполных данных. 2. Отметь что критично — и почему именно это нельзя убирать. 3. Отметь что можно убрать без потери точности: вводные фразы, объяснения «почему так», повторы. 4. Предложи сокращённую версию с сохранёнными якорями.
Источник: What Should a Skill Remember? Quality-Cost Trade-offs in Cost-Aware Skill Rewriting for Language Model Agents
ArXiv ID: 2606.09421 | Сгенерировано: 2026-06-09 05:39

Проблемы LLM

ПроблемаСутьКак обойти
Короткий промпт не значит дешевлеУбираешь «лишнее» из системного промпта. Текст стал короче. Но модель начинает блуждать: пробует варианты, пропускает шаги, переспрашивает. Токенов при выполнении тратится больше, чем с длинным промптом. Пример: упрощение пошаговых инструкций увеличивает итоговый расход токенов в 1,14 раза. Актуально для любого сжатия системных промптов и инструкцийНе режь всё подряд. Сначала определи тип задачи. Потом реши что сохранить: для кода — точный синтаксис и команды; для процессов — порядок шагов и условия перехода; для расчётов — формулы, пороги, исключения. Убирай только «обёртку»: вводные слова, объяснения «почему», повторы

Методы

МетодСуть
Зональный аудит промпта — режь обёртку, сохраняй якоряПеред сжатием определи тип задачи: код и инструменты / пошаговый процесс / правила и расчёты. Дальше по типу: код — сохрани точный синтаксис, команды, обработку ошибок; процесс — сохрани последовательность шагов и условия «если шаг не выполнен — стоп»; расчёты — сохрани формулы, числовые пороги, схемы и исключения. Всё остальное — убирай. Шаблон: Тип задачи: {код / процесс / расчёты}. Сохрани якоря этого типа. Убери объяснения, вводные слова, повторы. Текст: """ {текст} """. Почему работает: якоря — это точные инструкции. Модель держится за них и не интерпретирует в вольном стиле. Когда не работает: промпт смешанного типа — тогда аудируй зонами, не целиком
📖 Простыми словами

What Should a Skill Remember? Quality-Cost Trade-offs in Cost-Aware Skill Rewriting forLanguageModelAgents

arXiv: 2606.09421

Суть тут в том, что попытка сэкономить на длине системного промпта часто превращается в налог на глупость. Когда ты вырезаешь из инструкции «лишние» детали, чтобы платить меньше за входные токены, ты ломаешь внутреннюю логику модели. LLM не обладают памятью в человеческом смысле — они опираются только на то, что видят в окне контекста прямо сейчас. Если ты убрал жесткие инструкции, модель теряет ориентиры и начинает «галлюцинировать» или переспрашивать, генерируя в итоге гору бесполезного текста. В итоге ты платишь за раздутый выход, который стоит дороже, чем та копейка, которую ты сэкономил на входе.

Это как если бы ты отправил курьера в огромный бизнес-центр и вместо номера офиса, этажа и кода от двери просто сказал: «Ну, там где-то на месте разберешься». В итоге бедолага будет полчаса нарезать круги по коридорам, звонить тебе пять раз и тупить на ресепшене. Ты вроде сэкономил время на объяснении, но по факту получил кучу лишней суеты и сорванную доставку. С моделями та же история: без четких вводных они начинают «блуждать» по латентому пространству, выдавая мусор вместо результата.

Авторы исследования ввели крутое понятие — операционные якоря. Это те самые критические мелочи: точный синтаксис, конкретная формула или строгий порядок проверок. Эти детали занимают всего пару десятков токенов, но работают как рельсы для поезда. Например, если ты просишь модель считать налоги, фраза «используй ставку 13% для резидентов» — это якорь. Уберешь его ради краткости, и модель начнет рассуждать о налоговых кодексах разных стран, сожрет твой лимит и все равно выдаст лажу. Качество и стоимость здесь связаны напрямую: хороший промпт — это не короткий промпт, а тот, где оставлены правильные зацепки.

Хотя тест проводили на агентах и коде, принцип универсален для любой автоматизации. Будь то бот для поддержки клиентов или генератор контента для соцсетей — если ты выкидываешь из промпта нюансы стиля или конкретные ограничения, модель скатывается в «среднее по палате». Она начинает писать водянистые тексты в духе «в целом это важно», потому что у нее больше нет четкой задачи. Ты хотел сэкономить на API-запросах, а получил инструмент, который требует ручной доработки и бесконечных уточнений.

Короче: не пытайся кастрировать промпты до состояния телеграфного стиля. 60% успеха — это наличие якорей, которые не дают модели уйти в свободное плавание. Если после сокращения инструкции модель стала тратить больше токенов на ответ или начала ошибаться — ты перешагнул черту. Экономия на входе — это убытки на выходе. Оставляй конкретику, вырезай только вежливую чепуху и общие слова, иначе твой AI-агент превратится в дорогого и бестолкового советчика.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с