3,583 papers
arXiv:2605.21516 73 15 мая 2026 г. FREE

Partial Harnessing: почему детальный план ломает AI — и правило двух якорей

КЛЮЧЕВАЯ СУТЬ
Парадокс: чем детальнее пошаговая инструкция — тем хуже результат. Не потому что модель глупая, а потому что каждый переход между шагами — новая точка где что-то ломается. К шагу десять ошибки накопились по цепочке, и финал формальный вместо полезного. Partial Harnessing позволяет строить сложные промпты так, чтобы модель реально достигала цели, а не механически отмечала пункты списка. Прописываешь только первые 2–3 шага с реальными данными — дальше отпускаешь: модель сама строит путь к результату лучше, чем по твоим рельсам.
Адаптировать под запрос

TL;DR

Чем подробнее вы расписываете AI каждый шаг задачи — тем хуже может стать результат. Это задокументированный паттерн: избыточная структура вводит накопленные ошибки на каждом переходе между шагами. Partial Harnessing — принцип, который решает проблему: задай AI первые 2-3 критических шага как якоря, остальное отпусти — пусть AI достроит сам.

У AI есть оптимальный размер подзадачи. Слишком крупная — не справится за отведённое число шагов. Слишком мелкая — теряет связность: тратит усилия на переходы вместо реального продвижения. Если каждый шаг вашего промпта требует прогресса, который AI не может надёжно сделать в один ход — задача деградирует на каждом уровне, и итог хуже, чем если бы шагов было вдвое меньше.

Второй ключевой вывод — про галлюцинации. Инструкции без привязки к реальным данным ("будь подробнее", "звучи уверенно") физически усиливают галлюцинации. Инструкции, которые вытекают из конкретного контекста задачи — подавляют. Причём чем сильнее вы давите "неправильной" инструкцией, тем хуже становится. Это не нейтрализуется — это усиливается.


🔬

Схема метода

ПРИНЦИП 1 — Partial Harnessing (частичная спецификация)
  Задай явно: 2-3 ключевых начальных блока → в каком формате, что обязательно
  Отпусти: всё остальное — пусть AI выстроит сам
  Финал: укажи что должно быть на выходе, не как к нему прийти

ПРИНЦИП 2 — Granularity Alignment (размер шага)  
  Оцени: что AI реально может сделать за один шаг?
  Не дроби ниже этого уровня
  → Меньше шагов с нормальным размером > много мелких шагов

ПРИНЦИП 3 — Guidance-Evidence Alignment (обоснованность инструкций)
  Добавляй инструкции ТОЛЬКО если они вытекают из реальных данных в задаче
  Убирай: "будь подробным", "звучи уверенно", "дай развёрнутый ответ"
  Оставляй: "опирайся только на предоставленные данные", "не выходи за рамки X"

Все три принципа применяются при составлении промпта — в одном запросе.


🚀

Пример применения

Задача: Написать анализ для выхода бренда одежды на Wildberries — с разбором конкурентов, ценообразованием и рисками.

Плохой промпт (избыток структуры):

Шаг 1: проанализируй категорию
Шаг 2: составь таблицу конкурентов  
Шаг 3: определи ценовые диапазоны
Шаг 4: выяви топ-3 игрока
Шаг 5: рассчитай юнит-экономику
Шаг 6: опиши риски
Шаг 7: дай рекомендации...

Промпт с Partial Harnessing:

Напиши стратегический анализ выхода на Wildberries для бренда базовой одежды 
(футболки, худи, средний ценовой сегмент 1500–3500 ₽).

Начни с двух обязательных блоков:
1. Конкурентный ландшафт — топ-5 игроков в категории, их ценовой диапазон 
   и позиция по рейтингу
2. Ценовое позиционирование — где именно стоит войти и конкретное обоснование

После этих двух блоков выстраивай анализ сам — исходя из того, 
что логично для этой задачи.

В финале: конкретные рекомендации с цифрами и приоритетами.

Важно: не придумывай данные. Если факт неизвестен — обозначь как "требует 
проверки" и объясни где искать.

Результат: Модель выполнит первые два блока жёстко (заданы якоря с форматом), дальше выстроит логику сама — возможно, лучше, чем при 7 предписанных шагах. Финальный текст будет связным, без искусственных переходов. Инструкция про данные снизит вероятность выдуманных цифр — модель будет маркировать неизвестное вместо того, чтобы генерировать правдоподобную ложь.


🧠

Почему это работает

Где AI теряет качество при избытке структуры. Каждый жёстко заданный шаг — это маленькая задача с фиксированным "бюджетом" внимания. Если шаг слишком мелкий, AI тратит значительную часть этого бюджета на переход к следующему, а не на содержание. Ошибки накапливаются на каждом переходе. Исследователи называют это координационными потерями — вы сами создаёте их, добавляя структуру.

Что AI умеет хорошо. AI хорошо выстраивает связный текст от правильно заданной начальной точки. Если дать правильный старт и указать финал — модель часто сама находит нужный путь лучше, чем по жёсткому плану. Её "автономная" часть после якорей работает целостнее, чем принудительные переходы.

Как инструкции влияют на галлюцинации. "Будь подробным" — это сигнал расширять текст. AI расширяет через генерацию: там где нет данных, появляются правдоподобные выдумки. "Опирайся только на предоставленные факты" — это сигнал повышать вес обоснованных траекторий над генерирующими. Сильное давление неработающей инструкцией не нейтрализует эффект — оно его усиливает. Это ключевое: добавить больше "будь подробнее" → больше галлюцинаций, не меньше.

Рычаги управления: - Число якорей → 2-3 это норма, 5+ начинает работать против вас - Формат якорей → чем конкретнее ("топ-5 игроков с ценой"), тем точнее выполнение - Ограничения → только те, что вытекают из реальных данных задачи - Финал → укажи ЧТО должно быть на выходе (рекомендации, список, решение), но не КАК туда прийти


📋

Шаблон промпта

{Задача} — [что нужно сделать, контекст].

Начни с этих обязательных блоков:
1. {Якорь_1} — [что именно, в каком формате]
2. {Якорь_2} — [что именно, в каком формате]

После этих блоков выстраивай структуру самостоятельно — 
исходя из того, что логично для задачи.

В финале обязательно: {конкретный результат}.

Важно: {ограничение, вытекающее из реального контекста — 
например, "опирайся только на предоставленные данные" 
или "не выходи за рамки [конкретного периода/области]"}.

Что подставлять: - {Задача} — что нужно написать, проанализировать, разобрать - {Якорь_1}, {Якорь_2} — 2-3 блока, которые вам критически важны — где вы хотите контроль - {конкретный результат} — что должно быть на выходе (рекомендации, план, список с приоритетами) - {ограничение} — только то, что вытекает из реальных данных которые у вас есть


🚀 Быстрый старт — вставь в чат:

Вот шаблон Partial Harnessing — подход к заданию AI правильного уровня структуры. 
Адаптируй под мою задачу: [твоя задача]. 
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит какие блоки для тебя критичны и какой финальный результат нужен — потому что именно это определяет где задать якоря, а где отпустить задачу. Она возьмёт паттерн шаблона и адаптирует под твой кейс.


⚠️

Ограничения

⚠️ Для простых задач не нужен: Перевод текста, 3 тезиса, короткий список — Partial Harnessing здесь избыточен. Работает на сложных многошаговых задачах.

⚠️ Нужно знать свои якоря: Чтобы выбрать правильные 2-3 блока, нужно понимать что в задаче критически важно. Не знаешь — попроси AI предложить варианты якорей сначала, потом скорректируй.

⚠️ Исследование про агентов, не чаты: Выводы получены на автономных AI-агентах с инструментами (терминал, код) и на синтетических задачах. В обычном чате принципы логически выводятся, но прямых экспериментов именно на chat нет.

⚠️ Принцип, не формула: Это не техника с точным алгоритмом — это правило проектирования. Требует применения к конкретному случаю.


🔗

Ресурсы

Harnesses for Inference-Time Alignment over Execution Trajectories — Boyuan Wang, Bochao Li, Minghan Wang (equal contribution), Yuxin Tao, Fang Kong. Southern University of Science and Technology (SUSTech). Корреспонденция: taoyx@sustech.edu.cn, kongf@sustech.edu.cn.

Ключевые смежные работы из статьи: ReAct (Yao et al., 2022), DSPy (Khattab et al., 2023), TerminalBench v2.


📋 Дайджест исследования

Ключевая суть

Парадокс: чем детальнее пошаговая инструкция — тем хуже результат. Не потому что модель глупая, а потому что каждый переход между шагами — новая точка где что-то ломается. К шагу десять ошибки накопились по цепочке, и финал формальный вместо полезного. Partial Harnessing позволяет строить сложные промпты так, чтобы модель реально достигала цели, а не механически отмечала пункты списка. Прописываешь только первые 2–3 шага с реальными данными — дальше отпускаешь: модель сама строит путь к результату лучше, чем по твоим рельсам.

Принцип работы

Модель плохо работает как робот с чеклистом. Зато хорошо — как аналитик с чётко обозначенной целью. Первые шаги снимают неопределённость старта, не сковывая исполнение. Пропиши точку входа — и отпусти. Плюс работает второй механизм: если пишешь «оцени нарративную структуру и эмоциональные триггеры», но не даёшь реального текста под эти критерии — модель начинает выдумывать соответствие твоему формату. Каждая инструкция «как делать» должна опираться на материал, который ты предоставил. Нет материала — нет детальных инструкций. Иначе получаешь уверенную и красиво оформленную ложь.

Почему работает

У LLM сильная сторона — самостоятельное планирование внутри чётко обозначенной цели. Слабое место — накопление ошибок на длинных цепочках жёстких переходов. На каждом шаге модель «завершает» формально, даже если суть шага не достигнута по содержанию. К пятнадцатому шагу потери накопились каскадом по всей цепочке. Когда ты даёшь только первые шаги и отпускаешь — модель планирует изнутри, а не движется по рельсам. Ошибки не копятся, исполнение гибкое, финал содержательный.

Когда применять

Сложные многошаговые задачи в чате — анализ конкурентов, аудит текстов, разборы стратегий, исследование рынка — особенно когда хочется «прописать всё подробно чтобы ничего не пропустить». Вот именно тогда и нужен Partial Harnessing вместо полного сценария. НЕ подходит для: простых одношаговых запросов («переведи фразу»), задач с жёсткими требованиями к формату (юридический договор, финансовая отчётность), и ситуаций когда нет реального материала для анализа — тут никакая структура не спасёт, галлюцинации гарантированы.

Мини-рецепт

1. Сформулируй финальную цель: Не «анализ», а конкретно — «найти главную причину почему X», «написать предложение под аудиторию Y». Цель повторяется в конце промпта — это якорь для автономной части.
2. Дай реальный материал: Текст, цифры, описание ситуации. Без этого детальные инструкции порождают выдумки — модель будет подгонять реальность под твой формат.
3. Пропиши только первые 2–3 шага: Каждый должен быть выполнимым за один «ход» модели. Не «изучи конкурентов», а «найди элемент с максимальным разрывом между карточками».
4. Отпусти остальное: Финальная строка промпта: Дальше самостоятельно определи, что ещё важно проверить, чтобы достичь цели: {повтори цель}. Объясни свой выбор следующих шагов.

Примеры

[ПЛОХО] : Проанализируй два описания товара: 1. Сравни заголовки 2. Сравни описания 3. Оцени фото 4. Проверь SEO 5. Оцени отзывы 6. Проверь рейтинг 7. Сравни цену 8. Сделай вывод Модель пройдёт все восемь пунктов — формально и без реального инсайта. Отчёт будет, пользы мало.
[ХОРОШО] : Ты — эксперт по конверсии карточек на маркетплейсах. Задача: найти ключевые причины, почему карточка конкурента конвертирует лучше моей, и дать конкретные рекомендации. Моя карточка: [вставить текст]. Карточка конкурента: [вставить текст]. Начни так: Шаг 1 — определи, в каком элементе карточки разрыв максимален (заголовок, описание, отзывы, цена). Шаг 2 — глубоко разбери именно этот элемент: что конкурент делает иначе и почему это работает на покупателя. Дальше самостоятельно определи, что ещё важно проверить, чтобы ответить на вопрос: что менять в первую очередь? Модель начнёт с диагностики, найдёт реальное слабое место, углубится туда — и сама решит что ещё проверить, исходя из конкретных данных, а не обходя все десять пунктов по кругу.
Источник: Harnesses for Inference-Time Alignment over Execution Trajectories
ArXiv ID: 2605.21516 | Сгенерировано: 2026-05-22 06:36

Проблемы LLM

ПроблемаСутьКак обойти
Длинная пошаговая схема накапливает ошибкиРазбил задачу на 10–15 шагов — и каждый переход становится точкой риска. Модель "завершает" шаг формально. Цель шага не достигнута, но модель идёт дальше. К финалу потери сложились в цепочку. Итог: механический отчёт вместо реального результатаПропиши явно только первые 2–3 шага. Дальше напиши: "Определи сам, что ещё нужно сделать для цели: {цель}". Модель сама построит путь — и сделает это лучше, чем по детальному плану
Детальные инструкции без реального материала вызывают выдумкиПишешь "оцени тональность, нарративную структуру и эмоциональные триггеры" — но не даёшь текст для анализа. Модель не остановится и не скажет "данных нет". Она создаст материал, чтобы соответствовать твоему формату. Получишь красиво оформленную фикциюПравило: каждая инструкция "как делать" должна опираться на реальные данные в том же промпте. Нет данных — убери детальную инструкцию. Оставь только цель

Методы

МетодСуть
Частичная структура — запускай и отпускайДай модели роль, цель и 2 явных первых шага. Третьим шагом напиши: "Дальше сам определи, что важно проверить для цели: {повтори цель}. Объясни свой выбор." Шаблон: Ты — {роль}. Задача: {цель}. Данные: {материал}. Шаг 1 — {конкретное действие}. Шаг 2 — {углубление шага 1}. Дальше — самостоятельно определи что ещё нужно, чтобы достичь цели: {цель}. Почему работает: Первые шаги снимают неопределённость старта. Модель понимает с чего начать и на чём фокусироваться. Дальше она строит путь сама — это то, что она делает хорошо. Когда не работать: задача одношаговая; выходной документ требует строгого формата (договор, отчётность) — здесь полная структура оправдана
📖 Простыми словами

Harnesses for Inference-Time Alignment over Execution Trajectories

arXiv: 2605.21516

Суть в том, что современные нейронки — это не послушные роботы-исполнители, а скорее интуитивные импровизаторы. Когда ты прописываешь модели жесткий план из двадцати пунктов, она тратит все силы на то, чтобы не выйти за рамки инструкции, и в итоге теряет смысл самой задачи. Метод Partial Harnessing доказывает: чтобы получить крутой результат в сложных вычислениях или аналитике, нужно задать модели правильный вектор в самом начале, а дальше — отпустить вожжи. Модель гораздо лучше справляется с целью, когда сама выбирает траекторию движения, опираясь на заданный старт.

Это как учить человека водить машину. Ты можешь поминутно расписать ему: «через 40 секунд нажми сцепление, поверни руль на 15 градусов, посмотри в левое зеркало». Скорее всего, он врежется в первый же столб, потому что реальная дорога постоянно меняется. Гораздо эффективнее посадить его за руль, показать, как трогаться, и сказать: «нам нужно вон к тому торговому центру». В первом случае он исполняет алгоритм, во втором — решает задачу, адаптируясь к ситуации на ходу.

Главная проблема длинных инструкций — накопление ошибок. В цепочке из десяти жестких шагов малейший косяк на втором этапе превращает десятый в полную ахинею. Исследование показывает, что частичное структурирование (когда ты задаешь только «скелет» начала) работает лучше, потому что модель не тратит контекстное окно на удержание в памяти бесполезных правил. Она фокусируется на логике выполнения, а не на соблюдении формальностей, что критично для задач с кодом, математикой или глубоким аудитом.

Хотя метод тестировали на сложных траекториях исполнения, принцип универсален для любого промптинга. Будь то написание кода, создание маркетинговой стратегии или разбор карточек на маркетплейсах — перегруз деталями убивает качество. Вместо того чтобы диктовать каждый чих, нужно внедрять «точки контроля» только там, где модель обычно лажает. Это меняет подход к работе с AI: мы переходим от роли дотошного микроменеджера к роли стратегического наставника.

Короче, хватит писать промпты-простыни, где каждый шаг расписан до атомов — это путь к деградации ответов. Дай модели внятный старт, обозначь финальную цель и позволь ей самой проложить маршрут. Partial Harnessing подтверждает: свобода действий для LLM — это не риск, а инструмент повышения точности. Либо ты доверяешь архитектуре модели, либо получаешь формальную отписку, в которой соблюдены все пункты, но результат — полная фигня.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с