3,583 papers
arXiv:2605.25058 79 24 мая 2026 г. FREE

IST (Intent Signal Theory): почему модель выдаёт красивый, но не тот ответ — и как это исправить

КЛЮЧЕВАЯ СУТЬ
Модель не спрашивает уточнений. Когда чего-то не сказали — она тихо вставляет самый типичный вариант из обучения. Просишь питч без аудитории — получаешь питч для «среднего инвестора». Просишь анализ без контекста — получаешь «глобальный рынок». Ответ выглядит хорошо. Это не ваш ответ. Метод 5W3H позволяет явно прopisать то, что модель не угадает — и получить точно ваш результат, а не статистически средний. Фишка: одни измерения «публичные» — модель угадает сама, другие «приватные» — ваша уникальная специфика, которой в обучении нет. Восемь измерений (What, Why, Who, When, Where, How-to-do, How-much, How-feel) — это чеклист для поиска приватных. Нашёл приватные — явно вбей в промпт. Остальное можно опустить.
Адаптировать под запрос

TL;DR

IST — теоретический фреймворк, который формализует разрыв между тем, что пользователь имеет в виду, и тем, что он написал в промпте. В основе — различие между публичным намерением (то, что модель способна вывести из своих тренировочных данных) и приватным намерением (то, что уникально для вас и чего в этих данных нет). Если приватное не попало в промпт — модель физически не может его восстановить, сколько бы она ни была умна.

Классическая боль: вы просите сделать конкурентный анализ, модель выдаёт структурно безупречный результат — разделы есть, логика есть, читается хорошо. Но анализ написан для массового рынка, тогда как вы работаете с корпоративными клиентами, у вас специфические метрики и нестандартные конкуренты. Модель не ошиблась — она заполнила все слоты типичными значениями из обучения, потому что ваш специфический контекст не был в промпте. Это называется структурно-смысловой разрыв: модель восстановила форму, но подставила чужое содержание.

IST предлагает решение через явное кодирование всех приватных измерений намерения в промпт. Для этого вводится чек-лист из 8 измерений (5W3H): What, Why, Who, When, Where, How-to-do, How-much, How-feel. Прежде чем писать промпт — определяете, по каким из 8 измерений у вас есть специфика, которую модель не угадает. Всё это явно пишете в запросе.


🔬

Схема метода

ШАГ 0: Сформулируйте задачу — что вы хотите получить
ШАГ 1: Пройдите по 8 измерениям 5W3H — какие из них у вас СПЕЦИФИЧНЫ?
        What (что именно) / Why (зачем) / Who (для кого) /
        When (когда/контекст) / Where (где/платформа) /
        How-to-do (как именно) / How-much (сколько/параметры) /
        How-feel (тон/ощущение)
ШАГ 2: Отметьте "приватные" измерения — те, что уникальны для вас
        (модель не знает вашу аудиторию, ваши ограничения, ваш стиль)
ШАГ 3: Явно включите ВСЕ приватные измерения в промпт
ШАГ 4: Публичные измерения (общеизвестное) — можно опустить

Всё делается в одном промпте, никаких отдельных шагов с API не нужно.

🚀

Пример применения

Задача: Вы — основатель SaaS-стартапа. Нужно написать питч для акселератора ФРИИ. Стандартный запрос даст шаблонный питч про «инновационный продукт для широкого рынка». Но у вас всё специфично.

Промпт:

Напиши питч для подачи в акселератор ФРИИ.

**What:** B2B-инструмент для автоматизации документооборота в строительных компаниях
**Why:** Строители теряют 30% времени на согласование актов — мы убираем это через интеграцию с 1С и электронной подписью
**Who:** Аудитория питча — инвестиционный комитет ФРИИ, знаком с SaaS-метриками, скептичен к "ещё одному ЭДО"
**When:** Стадия — пре-сид, есть 3 платящих клиента, MRR 180 тыс. рублей, 4 месяца
**Where:** Формат — письменный питч, не слайды, лимит 500 слов
**How-to-do:** Структура — проблема → решение → рынок (только B2B строительство РФ, не говорить про "глобальный рынок") → тяга → команда → запрос
**How-much:** Запрашиваем 6 млн рублей за 7% доли
**How-feel:** Тон — уверенный, конкретный, без стартап-буллшита. Никаких "революционных решений" и "многомиллиардных рынков"

Результат: Модель сгенерирует питч, в котором каждый раздел будет заполнен именно вашими данными, а не типичными для SaaS. Не будет ни абстрактного «рынка ЭДО», ни придуманных метрик — только то, что вы задали. Особенно хорошо это работает на полях "Who" и "How-feel" — именно там обычно подставляется шаблонный контент вместо вашего.


🧠

Почему это работает

LLM — это шаблонная машина. Когда какое-то измерение отсутствует в промпте, модель не замирает в растерянности — она заполняет слот самым частым значением из обучающих данных. Просите питч без указания аудитории — получите питч для «среднего инвестора». Просите анализ без указания рынка — получите «глобальный рынок». Форма есть, содержание чужое.

Ключевой инсайт: модель не знает, чего она не знает. Она не скажет вам «уточните аудиторию». Она молча подставит типовое — и результат будет выглядеть хорошо. Именно поэтому структурно-смысловой разрыв так сложно заметить: ответ красив, но не ваш.

Рычаги управления: Чем детальнее вы заполняете приватные измерения — тем меньше модель компенсирует их из своего «среднего по больнице». Особенно это важно для Who (аудитория), Why (ваша специфическая причина, не общая) и How-feel (тон). Это те измерения, где разрыв между «типичным» и «вашим» максимален. How-much и What модели часто угадывают хорошо — это более «публичные» измерения.


📋

Шаблон промпта

{Задача}: {что нужно сделать}

**What:** {что именно — конкретный продукт/тема/объект}
**Why:** {зачем — ваша специфическая цель, не общая}
**Who:** {для кого — конкретная аудитория с характеристиками}
**When:** {контекст времени или стадии — если важен}
**Where:** {формат/платформа/канал — если специфичен}
**How-to-do:** {как именно — структура, подход, что включать/исключать}
**How-much:** {параметры — объём, цифры, ограничения}
**How-feel:** {тон, стиль, ощущение — что должно передаваться}

Пропусти измерения, которые стандартны и модель угадает сама.

Что подставлять: - {Задача} — глагол + существительное: "Напиши", "Проанализируй", "Составь" - Заполняйте только те измерения, где у вас специфика — где типичный ответ модели вас не устроит - Чем больше ваш контекст отlichается от стандартного — тем важнее явно прописать соответствующее измерение

🚀 Быстрый старт — вставь в чат:

Помоги мне составить промпт по методу 5W3H для следующей задачи: {твоя задача}.
Задай мне вопросы по каждому из 8 измерений (What, Why, Who, When, Where, 
How-to-do, How-much, How-feel), чтобы собрать мою специфику. 
Особенно интересуют "приватные" измерения — то, что ты не угадаешь из типичных данных.

[вставить шаблон выше]

LLM спросит ваши специфические параметры по каждому измерению — потому что именно они определяют разницу между «хорошим шаблонным ответом» и «точно вашим ответом».


⚠️

Ограничения

⚠️ Конвенциональные задачи: Если задача стандартна (написать резюме в классическом формате, объяснить простую тему), модель и так хорошо покрывает публичные измерения. 5W3H здесь избыточен.

⚠️ Теорема работает в обе стороны: Если вы сами не знаете свою специфику (аудиторию, цель, контекст) — никакой фреймворк не поможет. Инструмент для тех, кто знает, чего хочет, но не умеет это полностью сформулировать.

⚠️ Это теоретический фреймворк: Конкретный инструмент 5W3H/PPS описан в сопутствующих исследованиях (arXiv), а не в этой статье. Детали реализации — в четырёх отдельных работах.

⚠️ Одиночный запрос (single-turn): IST формализован только для диалога «один вопрос — один ответ». Для длинных многоходовых диалогов авторы говорят, что нужна отдельная теория.


🔍

Как исследовали

Команда Gang Peng (Университет Хуйчжоу, Китай) не просто предложила теорию — они заземлили её на четырёх последовательных эмпирических исследованиях, каждое из которых проверяло один уровень утверждений. Поведенческий уровень: 540 выходов по трём задачным доменам и трём китайским LLM — структурированный промпт стабильно лучше неструктурированного. Уровень обобщения: 2160 выходов на трёх языках (китайский, английский, японский) и шести семействах моделей — эффект не исчезает при переводе. Любопытная деталь: более слабые модели выигрывают от структурированного кодирования намерения сильнее, чем мощные — потому что у слабых моделей «публичных» знаний меньше, и явное кодирование компенсирует этот пробел. Уровень протокола: 3240 выходов, сравнение с CO-STAR и RISEN — структурированное намерение ведёт себя как протокол, а не просто «красивый шаблон». Уровень измерений: Самое показательное — в английском языке 58.6% ответов попали в «зону разрыва»: LLM-судья ставил им 5/5, а люди — 3.1/5 за тот же ответ. Это не аномалия, это системная слепота holistic-оценки к потере смысловой точности. Корреляция между людьми и LLM-судьёй на размерном инструменте — ρ=0.695, на общей оценке — ρ=0.251. Разрыв красноречив.


💡

Адаптации и экстраполяции

🔧 Техника: Аудит уже написанного промпта → где вы теряли смысл

Возьмите любой промпт, с которым получили «хороший, но не тот» ответ. Попросите LLM:

Проанализируй этот промпт по измерениям 5W3H:
What / Why / Who / When / Where / How-to-do / How-much / How-feel

Для каждого измерения скажи:
1. Явно ли оно указано в промпте?
2. Если нет — какое типичное значение модель скорее всего подставит?
3. Насколько это типичное значение может отличаться от намерения автора?

Промпт: {ваш промпт}

Модель покажет, какие измерения были «немыми» — и почему ответ ушёл в шаблон.


🔧 Техника: Reverse engineering чужого документа → узнать чужое намерение

IST работает и в обратную сторону. Если вам дали чей-то текст и просят в похожем стиле, вместо «напиши как это» — попросите модель сначала восстановить намерение автора:

Проанализируй этот текст через 5W3H. Что явно или неявно стоит за каждым измерением? 
Особенно интересует: Who (для кого писалось), Why (что автор хотел донести), 
How-feel (какой тон и эффект хотел создать)?

Текст: {текст}

Потом используйте восстановленные измерения как основу для нового текста в том же духе.


🔗

Ресурсы

Основная работа: Intent Signal Theory: A Computational Framework for Intent-State Control in Human–AI Interaction — Gang Peng, Huizhou University / Huizhou Lateni AI Technology Co., Ltd., Китай

Сопутствующие работы (четыре эмпирических исследования): - Peng, G. — Evaluating 5W3H structured prompting (arXiv) - Peng, G. — Dimension-level intent fidelity evaluation for LLMs (arXiv: 2605.14517) - Кросс-языковое и кросс-модельное исследование (arXiv) - Протокольное сравнение (CO-STAR, RISEN) (arXiv)

Теоретические основы, упоминаемые в статье: Shannon Information Theory (Cover & Thomas, 2006), Gricean Pragmatics, Norman's Gulfs of Execution


📋 Дайджест исследования

Ключевая суть

Модель не спрашивает уточнений. Когда чего-то не сказали — она тихо вставляет самый типичный вариант из обучения. Просишь питч без аудитории — получаешь питч для «среднего инвестора». Просишь анализ без контекста — получаешь «глобальный рынок». Ответ выглядит хорошо. Это не ваш ответ. Метод 5W3H позволяет явно прopisать то, что модель не угадает — и получить точно ваш результат, а не статистически средний. Фишка: одни измерения «публичные» — модель угадает сама, другие «приватные» — ваша уникальная специфика, которой в обучении нет. Восемь измерений (What, Why, Who, When, Where, How-to-do, How-much, How-feel) — это чеклист для поиска приватных. Нашёл приватные — явно вбей в промпт. Остальное можно опустить.

Принцип работы

Стандартный подход: задача + немного контекста. Проблема: модель сама решает, что считать контекстом — и решает по среднему из обучения. Альтернатива: разложи промпт по измерениям. Для каждого задай себе вопрос — угадает ли модель мою специфику? Если нет — пиши явно. Если да — пропусти. Особо приватные измерения: Who (твоя аудитория, не абстрактная), Why (твоя конкретная цель, не общая), How-feel (тон — именно твой, а не «профессиональный»). Именно там разрыв между типичным ответом и нужным максимален. How-much и What модели чаще угадывают — это более публичные измерения.

Почему работает

LLM — машина по заполнению шаблонов. Пустой слот — не пауза, не вопрос. Это сигнал взять самое частое значение из обучения. Результат выглядит структурно корректно — разделы есть, логика есть, читается легко. Именно поэтому структурно-смысловой разрыв так сложно заметить: ответ красив, но написан для чужой аудитории, с чужими ограничениями, в чужом тоне. Когда явно вбиваешь приватные измерения — модель перестаёт компенсировать пустоты шаблоном. Она работает с твоим контекстом, а не со статистическим средним по обучающей выборке.

Когда применять

Специализированные задачи → конкретная аудитория с характеристиками, особые ограничения, нестандартный тон. Особенно подходит когда: пишешь питч или презентацию (аудитория всегда специфична), делаешь маркетинговый текст (платформа и тон критичны), запрашиваешь профессиональный анализ (твои метрики и рынок, не «в целом по отрасли»). НЕ подходит для стандартных задач — объяснить термин, написать резюме в классическом формате, перевести текст. Там модель и так угадывает публичные измерения правильно. 5W3H там просто лишний шум.

Мини-рецепт

1. Задача одной строкой: что нужно сделать — глагол + объект.
2. Пройди по восьми: What, Why, Who, When, Where, How-to-do, How-much, How-feel.
3. Для каждого спроси себя: у меня есть специфика, которую модель не угадает?
4. Специфику — пиши явно. Стандартное — пропускай без сожалений.
5. Особо проверь Who и How-feel — именно там шаблонный ответ чаще всего не ваш.

Если не знаешь своих приватных измерений — можно спросить саму модель: Помоги составить промпт по методу 5W3H для задачи: {задача}. Задай вопросы по каждому из восьми измерений — особенно те, где ты не угадаешь мою специфику.

Примеры

[ПЛОХО] : Напиши питч для инвестора
[ХОРОШО] : Напиши питч для подачи в акселератор. What: B2B-инструмент для документооборота в строительных компаниях Why: убедить выдать 6 млн рублей за 7% — обосновать тягу, не идею Who: инвестиционный комитет ФРИИ, знаком с метриками, скептичен к «ещё одному ЭДО» How-much: 500 слов, пре-сид стадия, MRR 180 тыс. рублей, 4 месяца How-feel: уверенный, конкретный — без «революционных решений» и «многомиллиардных рынков» Модель заполнит каждый раздел вашими данными. Не придумает «глобальный рынок ЭДО» и не влепит абстрактную «инновационную команду».
Источник: Intent Signal Theory: A Computational Framework for Intent-State Control in Human-AI Interaction
ArXiv ID: 2605.25058 | Сгенерировано: 2026-05-26 07:37

Проблемы LLM

ПроблемаСутьКак обойти
Модель молча заполняет пропуски типовыми значениямиНе указал аудиторию — модель придумала среднестатистическую. Не указал тон — выбрала нейтральный корпоративный. Не указал рынок — написала "глобальный". Ответ выглядит хорошо: структура правильная, логика есть. Но содержание чужое. Модель не спросит. Не предупредит. Просто подставит типичное из обученияНайди измерения где у тебя есть специфика. Явно пропиши каждое из них в запросе. Что именно — ниже в методе

Методы

МетодСуть
Аудит 8 измерений перед запросомПеред тем как писать запрос — пройди по 8 вопросам: Что (конкретный объект/продукт), Зачем (твоя специфическая цель), Для кого (конкретная аудитория с характеристиками), Когда (стадия/контекст), Где (формат/платформа), Как делать (структура, что включать/исключать), Сколько (объём, цифры), Как должно ощущаться (тон, стиль). По каждому спроси себя: "Модель угадает это из типичных данных — или это уникально для меня?" Уникальные — пиши явно. Типичные — можно пропустить. Почему работает: Модель не может восстановить то, чего нет в запросе. Но всегда заполнит пустые слоты средним из обучения. Явное описание блокирует подстановку типового. Особое внимание на "Для кого", "Зачем" и "Как должно ощущаться" — именно там разрыв между типичным и твоим максимальный

Тезисы

ТезисКомментарий
Хороший ответ твой ответМодель выдаёт структурно правильный результат даже когда не понимает твой специфический контекст. Форма заполнена верно. Содержание — чужое: взято из самого частого в обучении. Это не ошибка модели — это нормальное поведение. Применяй: если ответ выглядит "правильно, но не совсем то" — проверь какие измерения ты не указал явно
📖 Простыми словами

Intent Signal Theory: AComputationalFramework for Intent-State Control in Human-AIInteraction

arXiv: 2605.25058

Суть Intent Signal Theory (IST) в том, что между твоими мыслями и текстом промпта лежит пропасть, которую нейронка не перепрыгнет. Модель оперирует публичным намерением — это весь тот усредненный опыт из интернета, на котором она училась. А у тебя в голове сидит приватное намерение — твои личные цели, контекст и хотелки. Если ты не вывалил это «приватное» в чат, модель физически не может его угадать. Она не телепат, она — статистический калькулятор, который просто подставляет наиболее вероятные слова.

Это как заказать в баре «что-нибудь вкусненькое». Бармен не полезет к тебе в мозг, чтобы узнать, что ты ненавидишь кинзу и обожаешь джин. Он просто нальет самый популярный коктейль из меню, который нравится «среднему посетителю». Формально заказ выполнен, но пить ты это не сможешь. В итоге ты получаешь не решение своей задачи, а среднестатистическую жвачку, потому что не дал модели зацепку, чтобы выйти за рамки шаблона.

Главный механизм здесь — заполнение слотов. Когда ты не указываешь детали, LLM не переспрашивает, а просто берет самое частое значение из своих данных. Если просишь написать питч для стартапа и не уточняешь, что твой продукт для суровых агрономов, модель выдаст восторженный текст для хипстеров из Кремниевой долины. 10 из 10 провалов в работе с AI случаются именно здесь: модель не лажает, она просто заполняет пустоту в твоем промпте мусором из интернета.

Исследование проводили на сложных когнитивных задачах, но принцип универсален для любого общения с нейронками. Будь то код, юридический договор или сценарий для YouTube — если ты не прописал специфику, ты получишь галлюцинацию здравого смысла. Модель всегда выбирает путь наименьшего сопротивления, подсовывая тебе «типовое решение», которое в 90% случаев оказывается бесполезным хламом.

Короче: хватит ждать от AI магии и понимания с полуслова. Если в промпте нет твоего уникального контекста, модель выдаст белый шум, упакованный в красивую обертку. IST доказывает, что точность ответа напрямую зависит от того, насколько плотно ты «забил» приватными данными каждый свободный слот в запросе. Либо ты диктуешь условия, либо за тебя это делает статистическая вероятность, и результат тебе точно не понравится.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с