TL;DR
Модели умеют распознавать неоднозначность запроса, но по умолчанию скрывают это и отвечают как будто всё понятно. Если напрямую спросить ChatGPT «этот вопрос неоднозначный?» — она часто ответит «да, потому что...». Но если просто задать тот же вопрос — уверенно ответит на одну из интерпретаций, даже не намекнув, что вы могли иметь в виду что-то другое.
Причина в обучении: людям платили за оценку ответов, и они ставили высокие оценки за конкретные уверенные ответы — и низкие за «подождите, уточните». Модель выучила: _задавать вопросы = плохо, отвечать уверенно = хорошо_. Спросишь «кто такой Иван Иванов?» — получишь ответ про одного конкретного. Хотя таких людей — тысячи.
Решение простое: явно потребовать уточнений в промпте — и поведение меняется. Есть важный сюрприз: когда вы даёте модели много контекста (вставляете документ, описание, статью), она ещё реже задаёт уточняющие вопросы — решает, что ответ уже нашла в тексте. Больше контекста ≠ меньше неоднозначности.
Схема метода
(Всё работает в одном промпте — отдельных запросов не нужно)
ШАГ 1: Инструкция → "Перед ответом проверь запрос на неоднозначность"
ШАГ 2: Список типов → перечисли 6 видов неоднозначности (см. ниже)
ШАГ 3: Условие → "Задай вопросы — отвечай только после моих ответов"
ШАГ 4: Запрос → вставь реальную задачу
Пример применения
Задача: Маша — основатель небольшого Telegram-канала про финансы. Просит ChatGPT помочь с контентом. Стандартный запрос «помоги с постом» обычно даёт что-то среднее — потому что модель сама додумала аудиторию, тему, тон.
Промпт:
Перед тем как начать — проверь мой запрос на неоднозначность.
Проверь по этим типам:
— Временная: о каком периоде речь?
— Личность/объект: о каком конкретно человеке, компании или продукте?
— Версия: о какой версии, редакции или формате?
— Масштаб: насколько детально? (общий обзор или глубокий разбор)
— Смысл: слово или фраза допускает разные трактовки?
— Geography/регион: для какой аудитории — Россия, СНГ, весь мир?
Если находишь неоднозначность хотя бы по одному пункту — задай уточняющий вопрос.
Не отвечай на сам запрос, пока не получишь ответы.
Мой запрос: Напиши пост для моего канала про инвестиции.
Результат:
Модель не бросится писать пост. Сначала задаст конкретные вопросы — скорее всего про аудиторию (новички или опытные?), тему (какой именно инструмент?), тон (обучающий или провокационный?), длину. После ответов напишет пост точно под задачу, а не усреднённую заготовку.
Почему это работает
LLM генерирует следующий токен на основе паттернов из обучения. Обучение на оценках людей закрепило паттерн «уверенный ответ = хорошо». Поэтому модель по умолчанию выбирает самую вероятную интерпретацию и идёт с ней — не потому что она уверена, а потому что так её научили отвечать.
Когда вы явно пишете «проверь на неоднозначность и спроси», вы активируете другой паттерн — тот, которому модель тоже обучена (и который прекрасно работает, просто не включается сам). Модель умеет задавать хорошие уточняющие вопросы. Ей просто никто не говорит, что это нужно делать.
Почему контекст мешает? Когда вы вставляете документ или описание, модель интерпретирует это как сигнал: «вопрос решаем, информация есть». Она переключается в режим «найди ответ в тексте» и перестаёт думать о том, правильно ли вообще сформулирован вопрос. Много контекста = модель реже спросит, правильно ли вы друг друга поняли.
Таксономия неоднозначности
Исследователи выделили шесть типов — полезно знать, чтобы самому замечать неточности в своих запросах:
| Тип | В чём проблема | Пример |
|---|---|---|
| Временная | Не указан период | «Кто возглавлял компанию?» — когда? |
| Личность | Несколько людей/объектов с одним именем | «Расскажи про Иванова» — которого? |
| Версия | Несколько версий одного явления | «Как работает алгоритм?» — 2020 или 2024? |
| Масштаб | Непонятна глубина детализации | «Где воевали в ВОВ?» — весь фронт или одна битва? |
| Смысл | Слово допускает разные трактовки | «Сделай текст живым» — значит что? |
| Регион | Не указана география | «Когда выходит сезон?» — в России или в США? |
Шаблон промпта
Перед тем как отвечать — проверь мой запрос на неоднозначность.
Проверь по этим типам:
— Временная: о каком периоде/времени речь?
— Личность/объект: о каком конкретном человеке, компании или предмете?
— Версия: о какой версии, редакции или формате?
— Масштаб: насколько детально отвечать — общий обзор или глубокий разбор?
— Смысл: слово или фраза допускает разные трактовки?
— Регион: для какой аудитории или рынка?
Если находишь неоднозначность хотя бы по одному пункту — задай уточняющий вопрос по каждому.
Начни отвечать на запрос только после того, как получишь мои ответы.
Мой запрос: {запрос}
Что подставлять:
- {запрос} — любая ваша задача: написать текст, дать совет, проанализировать ситуацию, составить план
Адаптации и экстраполяции
Упрощённая версия — для быстрых задач
Если не хотите весь список типов, достаточно одной строки в начале промпта:
💡 Один триггер вместо таксономии:
Если в моём запросе есть неоднозначность — задай уточняющий вопрос, прежде чем отвечать.
{запрос}
Работает хуже на сложных многослойных запросах, зато не увеличивает промпт.
Обратный режим — когда нужен ответ, а не вопросы
🔧 Техника: явно закрыть все интерпретации заранее → убрать лишние уточнения
Если вы знаете, что запрос неоднозначный, но хотите конкретный ответ — раскройте интерпретацию в промпте сами:
Отвечай для этого контекста:
— Период: 2024 год
— Аудитория: начинающие предприниматели в России
— Масштаб: практические советы, не теория
— Формат: пост в Telegram, 300–400 слов
Запрос: {запрос}
Модель получает все «ответы на уточняющие вопросы» сразу — и сразу переходит к делу.
Режим «Аудит неоднозначности»
💡 Адаптация для ревью задач и ТЗ:
Когда нужно проверить, правильно ли формулировка будет понята другим человеком (или командой), попросите модель сыграть роль «придирчивого читателя»:
Прочитай этот текст/задание как человек, который будет его выполнять.
Найди все места, где исполнитель может понять задачу по-разному.
Для каждого — объясни в чём неоднозначность и как её можно трактовать.
Ничего не исправляй — только укажи проблемные места.
Текст: {текст}
Полезно для технических заданий, брифов, инструкций команде.
Ограничения
⚠️ Срабатывает не у всех моделей одинаково: Claude задаёт уточняющие вопросы охотнее других — даже без инструкции. GPT в режиме по умолчанию почти никогда. После явной инструкции — почти все модели ведут себя похоже.
⚠️ Контекст глушит уточнения: Чем больше текста вы вставили в промпт (документ, переписку, описание), тем меньше модель будет склонна спрашивать — даже если инструкция есть. Если контекст большой — усиливайте инструкцию: «задавай вопросы, даже если кажется, что ответ есть в тексте».
⚠️ Модели переоценивают неоднозначность по Личности и Версии — и недооценивают по Масштабу. Если ваш запрос про уровень детализации — прямо укажите это как приоритет для проверки.
Как исследовали
Команда Корнелла взяла датасет AmbigQA — 1000 вопросов, половина из которых реально неоднозначны (575 штук, каждый в среднем допускает 4,3 разные трактовки). Проверили 10 моделей: GPT-4.1, GPT-4o, Claude Sonnet/Haiku, Qwen. Каждую модель гоняли в трёх режимах: просто ответь, оцени неоднозначность, и поведенческий анализ (что модель делает — отвечает, отказывается или спрашивает).
Главный результат оказался острее, чем ожидали: даже когда модель только что сказала «этот вопрос неоднозначный» — в режиме «просто ответь» она почти никогда не задавала уточняющих вопросов. Частота уточнений — меньше 5% у Claude (лидер), остальные — почти ноль. При этом точность ответов на неоднозначные вопросы на 10–15 процентных пунктов ниже, чем на однозначные.
Контрольная проверка с добавлением контекста (статьи из Википедии) показала неожиданное: точность выросла, а желание уточнить — упало ещё сильнее. Парадокс объяснился просто: модель воспринимает наличие контекста как сигнал «вопрос решаем» — и перестаёт думать о том, правильно ли вопрос сформулирован. Это прямое следствие обучения: люди ценили конкретные ответы, и модель выучила избегать уточнений.
Ресурсы
Knowing but Not Showing: LLMs Recognize Ambiguity but Rarely Ask Clarifying Questions Jinyan Su, Claire Cardie — Cornell University Preprint, май 2025 js3673@cornell.edu
Датасет: AmbigQA (Min et al., 2020) Смежные работы: CoCoNot (Brahman et al., 2024), ClariQ (Aliannejadi et al., 2020)
