TL;DR
IST — теоретический фреймворк, который формализует разрыв между тем, что пользователь имеет в виду, и тем, что он написал в промпте. В основе — различие между публичным намерением (то, что модель способна вывести из своих тренировочных данных) и приватным намерением (то, что уникально для вас и чего в этих данных нет). Если приватное не попало в промпт — модель физически не может его восстановить, сколько бы она ни была умна.
Классическая боль: вы просите сделать конкурентный анализ, модель выдаёт структурно безупречный результат — разделы есть, логика есть, читается хорошо. Но анализ написан для массового рынка, тогда как вы работаете с корпоративными клиентами, у вас специфические метрики и нестандартные конкуренты. Модель не ошиблась — она заполнила все слоты типичными значениями из обучения, потому что ваш специфический контекст не был в промпте. Это называется структурно-смысловой разрыв: модель восстановила форму, но подставила чужое содержание.
IST предлагает решение через явное кодирование всех приватных измерений намерения в промпт. Для этого вводится чек-лист из 8 измерений (5W3H): What, Why, Who, When, Where, How-to-do, How-much, How-feel. Прежде чем писать промпт — определяете, по каким из 8 измерений у вас есть специфика, которую модель не угадает. Всё это явно пишете в запросе.
Схема метода
ШАГ 0: Сформулируйте задачу — что вы хотите получить
ШАГ 1: Пройдите по 8 измерениям 5W3H — какие из них у вас СПЕЦИФИЧНЫ?
What (что именно) / Why (зачем) / Who (для кого) /
When (когда/контекст) / Where (где/платформа) /
How-to-do (как именно) / How-much (сколько/параметры) /
How-feel (тон/ощущение)
ШАГ 2: Отметьте "приватные" измерения — те, что уникальны для вас
(модель не знает вашу аудиторию, ваши ограничения, ваш стиль)
ШАГ 3: Явно включите ВСЕ приватные измерения в промпт
ШАГ 4: Публичные измерения (общеизвестное) — можно опустить
Всё делается в одном промпте, никаких отдельных шагов с API не нужно.
Пример применения
Задача: Вы — основатель SaaS-стартапа. Нужно написать питч для акселератора ФРИИ. Стандартный запрос даст шаблонный питч про «инновационный продукт для широкого рынка». Но у вас всё специфично.
Промпт:
Напиши питч для подачи в акселератор ФРИИ.
**What:** B2B-инструмент для автоматизации документооборота в строительных компаниях
**Why:** Строители теряют 30% времени на согласование актов — мы убираем это через интеграцию с 1С и электронной подписью
**Who:** Аудитория питча — инвестиционный комитет ФРИИ, знаком с SaaS-метриками, скептичен к "ещё одному ЭДО"
**When:** Стадия — пре-сид, есть 3 платящих клиента, MRR 180 тыс. рублей, 4 месяца
**Where:** Формат — письменный питч, не слайды, лимит 500 слов
**How-to-do:** Структура — проблема → решение → рынок (только B2B строительство РФ, не говорить про "глобальный рынок") → тяга → команда → запрос
**How-much:** Запрашиваем 6 млн рублей за 7% доли
**How-feel:** Тон — уверенный, конкретный, без стартап-буллшита. Никаких "революционных решений" и "многомиллиардных рынков"
Результат: Модель сгенерирует питч, в котором каждый раздел будет заполнен именно вашими данными, а не типичными для SaaS. Не будет ни абстрактного «рынка ЭДО», ни придуманных метрик — только то, что вы задали. Особенно хорошо это работает на полях "Who" и "How-feel" — именно там обычно подставляется шаблонный контент вместо вашего.
Почему это работает
LLM — это шаблонная машина. Когда какое-то измерение отсутствует в промпте, модель не замирает в растерянности — она заполняет слот самым частым значением из обучающих данных. Просите питч без указания аудитории — получите питч для «среднего инвестора». Просите анализ без указания рынка — получите «глобальный рынок». Форма есть, содержание чужое.
Ключевой инсайт: модель не знает, чего она не знает. Она не скажет вам «уточните аудиторию». Она молча подставит типовое — и результат будет выглядеть хорошо. Именно поэтому структурно-смысловой разрыв так сложно заметить: ответ красив, но не ваш.
Рычаги управления: Чем детальнее вы заполняете приватные измерения — тем меньше модель компенсирует их из своего «среднего по больнице». Особенно это важно для Who (аудитория), Why (ваша специфическая причина, не общая) и How-feel (тон). Это те измерения, где разрыв между «типичным» и «вашим» максимален. How-much и What модели часто угадывают хорошо — это более «публичные» измерения.
Шаблон промпта
{Задача}: {что нужно сделать}
**What:** {что именно — конкретный продукт/тема/объект}
**Why:** {зачем — ваша специфическая цель, не общая}
**Who:** {для кого — конкретная аудитория с характеристиками}
**When:** {контекст времени или стадии — если важен}
**Where:** {формат/платформа/канал — если специфичен}
**How-to-do:** {как именно — структура, подход, что включать/исключать}
**How-much:** {параметры — объём, цифры, ограничения}
**How-feel:** {тон, стиль, ощущение — что должно передаваться}
Пропусти измерения, которые стандартны и модель угадает сама.
Что подставлять:
- {Задача} — глагол + существительное: "Напиши", "Проанализируй", "Составь"
- Заполняйте только те измерения, где у вас специфика — где типичный ответ модели вас не устроит
- Чем больше ваш контекст отlichается от стандартного — тем важнее явно прописать соответствующее измерение
🚀 Быстрый старт — вставь в чат:
Помоги мне составить промпт по методу 5W3H для следующей задачи: {твоя задача}.
Задай мне вопросы по каждому из 8 измерений (What, Why, Who, When, Where,
How-to-do, How-much, How-feel), чтобы собрать мою специфику.
Особенно интересуют "приватные" измерения — то, что ты не угадаешь из типичных данных.
[вставить шаблон выше]
LLM спросит ваши специфические параметры по каждому измерению — потому что именно они определяют разницу между «хорошим шаблонным ответом» и «точно вашим ответом».
Ограничения
⚠️ Конвенциональные задачи: Если задача стандартна (написать резюме в классическом формате, объяснить простую тему), модель и так хорошо покрывает публичные измерения. 5W3H здесь избыточен.
⚠️ Теорема работает в обе стороны: Если вы сами не знаете свою специфику (аудиторию, цель, контекст) — никакой фреймворк не поможет. Инструмент для тех, кто знает, чего хочет, но не умеет это полностью сформулировать.
⚠️ Это теоретический фреймворк: Конкретный инструмент 5W3H/PPS описан в сопутствующих исследованиях (arXiv), а не в этой статье. Детали реализации — в четырёх отдельных работах.
⚠️ Одиночный запрос (single-turn): IST формализован только для диалога «один вопрос — один ответ». Для длинных многоходовых диалогов авторы говорят, что нужна отдельная теория.
Как исследовали
Команда Gang Peng (Университет Хуйчжоу, Китай) не просто предложила теорию — они заземлили её на четырёх последовательных эмпирических исследованиях, каждое из которых проверяло один уровень утверждений. Поведенческий уровень: 540 выходов по трём задачным доменам и трём китайским LLM — структурированный промпт стабильно лучше неструктурированного. Уровень обобщения: 2160 выходов на трёх языках (китайский, английский, японский) и шести семействах моделей — эффект не исчезает при переводе. Любопытная деталь: более слабые модели выигрывают от структурированного кодирования намерения сильнее, чем мощные — потому что у слабых моделей «публичных» знаний меньше, и явное кодирование компенсирует этот пробел. Уровень протокола: 3240 выходов, сравнение с CO-STAR и RISEN — структурированное намерение ведёт себя как протокол, а не просто «красивый шаблон». Уровень измерений: Самое показательное — в английском языке 58.6% ответов попали в «зону разрыва»: LLM-судья ставил им 5/5, а люди — 3.1/5 за тот же ответ. Это не аномалия, это системная слепота holistic-оценки к потере смысловой точности. Корреляция между людьми и LLM-судьёй на размерном инструменте — ρ=0.695, на общей оценке — ρ=0.251. Разрыв красноречив.
Адаптации и экстраполяции
🔧 Техника: Аудит уже написанного промпта → где вы теряли смысл
Возьмите любой промпт, с которым получили «хороший, но не тот» ответ. Попросите LLM:
Проанализируй этот промпт по измерениям 5W3H:
What / Why / Who / When / Where / How-to-do / How-much / How-feel
Для каждого измерения скажи:
1. Явно ли оно указано в промпте?
2. Если нет — какое типичное значение модель скорее всего подставит?
3. Насколько это типичное значение может отличаться от намерения автора?
Промпт: {ваш промпт}
Модель покажет, какие измерения были «немыми» — и почему ответ ушёл в шаблон.
🔧 Техника: Reverse engineering чужого документа → узнать чужое намерение
IST работает и в обратную сторону. Если вам дали чей-то текст и просят в похожем стиле, вместо «напиши как это» — попросите модель сначала восстановить намерение автора:
Проанализируй этот текст через 5W3H. Что явно или неявно стоит за каждым измерением?
Особенно интересует: Who (для кого писалось), Why (что автор хотел донести),
How-feel (какой тон и эффект хотел создать)?
Текст: {текст}
Потом используйте восстановленные измерения как основу для нового текста в том же духе.
Ресурсы
Основная работа: Intent Signal Theory: A Computational Framework for Intent-State Control in Human–AI Interaction — Gang Peng, Huizhou University / Huizhou Lateni AI Technology Co., Ltd., Китай
Сопутствующие работы (четыре эмпирических исследования): - Peng, G. — Evaluating 5W3H structured prompting (arXiv) - Peng, G. — Dimension-level intent fidelity evaluation for LLMs (arXiv: 2605.14517) - Кросс-языковое и кросс-модельное исследование (arXiv) - Протокольное сравнение (CO-STAR, RISEN) (arXiv)
Теоретические основы, упоминаемые в статье: Shannon Information Theory (Cover & Thomas, 2006), Gricean Pragmatics, Norman's Gulfs of Execution
