3,583 papers
arXiv:2606.08239 70 6 июня 2026 г. FREE

Вынужденный выбор: LLM всегда выбирает из предложенных вариантов — даже когда правильного нет

КЛЮЧЕВАЯ СУТЬ
Модель прошла обучение на миллионах тестов с гарантированным правильным ответом в списке. Рефлекс усвоен намертво: есть варианты — выбирай один. Дай три слабых слогана — получишь уверенное 'вариант Б' вместо честного 'все три провальные'. Метод позволяет разбить этот рефлекс и получить настоящее 'ни один не подходит' — когда это правда. Два приёма в одном запросе: дай явное разрешение отказаться от выбора плюс заставь оценить каждый вариант словами до финалавероятность честного ответа вырастает в два-три раза. Но предупреждение сразу: проблема не решается промптом полностью — авторы прямо говорят, что нужны изменения на уровне обучения модели.
Адаптировать под запрос

TL;DR

LLM обучены на миллионах тестовых заданий, где правильный ответ всегда присутствует среди вариантов. Это создало устойчивый паттерн: модель почти всегда выбирает один из предложенных вариантов — даже если ни один не подходит. Исследование назвало это forced-choice bias (предрасположенность к принудительному выбору), воспроизвело в строгом эксперименте и измерило его масштаб.

Практическая боль: представьте, что вы даёте Claude три варианта оффера для клиента и просите выбрать лучший. Среди них нет хорошего — все три слабые. Модель всё равно выдаст уверенное «вариант Б» вместо «ни один не работает». Вы получите псевдо-экспертную рекомендацию вместо честной оценки.

Частичное решение есть: явно добавить в запрос опцию «ни один из вариантов не подходит» — и попросить модель пошагово оценить каждый вариант по критериям до финального выбора. Chain-of-Thought (пошаговое рассуждение) удваивает и утраивает вероятность честного ответа. Полностью проблему это не закрывает, но делает оценку значительно надёжнее.


🔬

Схема метода

Это не один метод, а комбинация двух приёмов, которые работают вместе:

ПРИЁМ 1: Явное разрешение
  Добавить в конец запроса: "Если ни один из вариантов не подходит — 
  так и скажи" → снижает давление принудительного выбора

ПРИЁМ 2: CoT-оценка каждого варианта (в одном промпте)
  ШАГ 1: Оцени каждый вариант по очереди → вывод плюсов/минусов
  ШАГ 2: Сравни с критерием → вывод соответствия
  ШАГ 3: Финальный выбор или "ни один" → обоснованный ответ

Оба приёма — в одном запросе, один диалог.

🚀

Пример применения

Задача: Артемий Лебедев попросил вас отобрать слоган для нового проекта. У вас есть три варианта от копирайтера, но внутри чувствуете — что-то не то. Вы хотите честную оценку, а не «лучший из плохих».

Промпт:

Ты — креативный директор, который жёстко oценивает тексты.

Задача: выбрать слоган для дизайн-студии, работающей с госзаказами. 
Целевая аудитория — чиновники и госкорпорации.

Критерии хорошего слогана: запоминается, звучит профессионально, 
внушает доверие, без пафоса.

Варианты:
А. «Государственный масштаб, частная точность»
Б. «Мы делаем государство красивее»
В. «Дизайн для страны»

Оцени каждый вариант отдельно: что работает, что нет, 
насколько соответствует критериям. Думай вслух по каждому.

Если ни один из вариантов не соответствует критериям — 
прямо скажи об этом. Не выбирай «лучший из плохих» 
только потому что нужно что-то выбрать.

Результат: Модель пройдёт по каждому слогану отдельно — назовёт конкретные проблемы. Если все три слабые, скажет это прямо с объяснением. Если один рабочий — выберет с аргументами. Вы получите честную оценку, а не псевдовыбор.


🧠

Почему это работает

Слабость LLM. Модели прошли обучение на огромном количестве тестов и заданий формата «выбери правильный ответ». Там правильный вариант всегда был в списке. Модель выучила этот паттерн: если дали варианты — надо выбрать один. Это не баг в логике, это усвоенное ожидание.

Почему CoT помогает. Когда модель генерирует текст по шагам, она вынуждена сначала сформулировать оценку каждого варианта словами — а потом принять решение. Словесная оценка фиксирует противоречие: «этот вариант не соответствует критериям → и тот не соответствует → и этот тоже → значит, правильного нет». Без CoT модель перескакивает сразу к выбору, не проходя через это рассуждение.

Рычаги управления: - Явная фраза «не выбирай лучшее из плохого» — прямо снимает ожидание обязательного выбора - «Думай вслух по каждому» — запускает пошаговую оценку - Конкретные критерии — даёт модели точку отсчёта для оценки, а не расплывчатое «хорошо/плохо» - Роль критика — усиливает оценочную позицию, ослабляет позицию «помощника, который должен помочь выбрать»


📋

Шаблон промпта

Ты — {роль-критика}.

Задача: выбрать {что выбираем} для {контекст}.
Аудитория / назначение: {кому / зачем}.

Критерии хорошего {что выбираем}:
— {критерий 1}
— {критерий 2}
— {критерий 3}

Варианты:
А. {вариант А}
Б. {вариант Б}
В. {вариант В}

Оцени каждый вариант отдельно: что работает, что нет, 
насколько соответствует критериям. Думай вслух.

Если ни один не соответствует критериям — скажи прямо. 
Не выбирай «лучшее из плохого» ради выбора.

Что подставлять: - {роль-критика} — эксперт, который оценивает жёстко: «опытный редактор», «стратегический консультант», «директор по маркетингу с 15-летним опытом» - {что выбираем} — слоган, концепцию, кандидата, формулировку, подход - {контекст} — кратко суть проекта или задачи - {критерии} — конкретные измеримые требования, не «хорошо» а «запоминается», «без жаргона», «до 7 слов»


🚀 Быстрый старт — вставь в чат:

Вот шаблон для честной оценки вариантов без принудительного выбора. 
Адаптируй под мою задачу: [твоя задача — что выбираешь, для чего, 
какие варианты]. Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит про критерии и контекст — потому что без них оценка каждого варианта «вслух» теряет точку отсчёта. Она возьмёт структуру из шаблона и адаптирует под твою задачу.


⚠️

Ограничения

⚠️ CoT не решает проблему полностью: даже с пошаговым рассуждением модели часто всё равно выбирают один из вариантов. Вероятность честного «ни один не подходит» растёт, но остаётся ниже 50% на сложных задачах.

⚠️ Чем «правдоподобнее» плохие варианты — тем сильнее искажение: если варианты похожи на правильный ответ (близкие по формулировкам, близкие по смыслу), модель с большей вероятностью выберет один из них. Особенно если варианты покрывают одну тему с небольшими различиями.

⚠️ Не работает для вкусовых суждений: исследование фиксирует проблему в ситуациях с объективно верным ответом. Для оценки «нравится / не нравится» — другая история, там нет отсутствующего правильного ответа как такового.

⚠️ Это не лечится промптом полностью: авторы прямо говорят — проблема требует изменений на уровне обучения модели, не только инструкций. CoT — костыль, не решение.


🔍

Как исследовали

Команда Duke University придумала элегантный трюк: взяли стандартные тесты для видео-моделей (где правильный ответ всегда есть среди вариантов), убрали правильный ответ из списка — и смотрели, что будет. Если модель действительно понимает видео, она должна сказать «правильного ответа нет». Если просто выбирает «наиболее похожее» — возьмёт дистрактор с уверенным видом.

Проверили почти все топовые мультимодальные модели: Gemini, Qwen, InternVL, Gemma. Три режима: вариант «ни один из перечисленных» добавлен явно в список; модель может написать это словами сама; стандартный формат без подсказок.

Результат оказался неожиданно резким. Без подсказок — почти 0% детекции у всех моделей. С явным вариантом «ни один» — лучшая модель (Gemini 2.5 Flash) добирается до 34%. Больше кадров из видео парадоксально ухудшает результат: модель лучше понимает видео, но сильнее «привязывается» к похожим вариантам и реже признаёт их неправильность. CoT даёт скачок — у Qwen3-VL с 17% до 48% — но «потолок» всё равно остаётся низким.

Самый тревожный инсайт: модели уверены в своём неправильном выборе так же, как в правильном. Убрали верный ответ — вероятность выбора дистрактора практически не изменилась. Это не неуверенность с ошибкой, это уверенная ошибка.


💡

Адаптации и экстраполяции

1. Адаптация: явный «предохранитель» в любом оценочном промпте

🔧 Добавить одну фразу → честнее оценка

В конце любого промпта с выбором из вариантов:

Если ни один из вариантов не соответствует задаче — 
скажи прямо и объясни почему. Не выбирай «лучший из плохих».

Работает даже без полного CoT-шаблона. Минимальный «предохранитель» от принудительного выбора.

2. Экстраполяция: обратный режим — проверка своих вариантов

Принцип работает и в обратную сторону. Если вы сами предлагаете варианты и хотите знать, есть ли среди них рабочий — дайте модели явное разрешение сказать «нет»:

Я разрабатываю {что}. Вот мои варианты:
А. {вариант}
Б. {вариант}
В. {вариант}

Критерии: {список}.

Оцени каждый вариант вслух: плюсы, минусы, соответствие критериям.
Если ни один не работает — скажи прямо. Мне нужна честная оценка, 
а не одобрение ради одобрения.

Это особенно полезно когда вы уже вложили работу в варианты и мозг хочет подтверждения — именно тогда модель без разрешения «откажет» вам в критике.


🔗

Ресурсы

When No Answer Is Correct: Diagnosing Absent Answer Detection for MLLMs in Video Understanding

Yiheng Wang, Yueqian Lin, Lichen Zhu, Yudong Liu, Hai "Helen" Li, Yiran Chen — Duke University, Durham, North Carolina, USA

Бенчмарки: VideoMME, EgoSchema


📋 Дайджест исследования

Ключевая суть

Модель прошла обучение на миллионах тестов с гарантированным правильным ответом в списке. Рефлекс усвоен намертво: есть варианты — выбирай один. Дай три слабых слогана — получишь уверенное 'вариант Б' вместо честного 'все три провальные'. Метод позволяет разбить этот рефлекс и получить настоящее 'ни один не подходит' — когда это правда. Два приёма в одном запросе: дай явное разрешение отказаться от выбора плюс заставь оценить каждый вариант словами до финалавероятность честного ответа вырастает в два-три раза. Но предупреждение сразу: проблема не решается промптом полностью — авторы прямо говорят, что нужны изменения на уровне обучения модели.

Принцип работы

Стандартный запрос 'выбери лучший' — модель пропускает оценку и сразу тянется к ответу. Это как спросить судью 'кто выиграл матч' без его просмотра — судья что-нибудь назовёт, потому что так положено. Правило: сначала оцени каждый вариант словами по критериям — потом решай. Словесная оценка фиксирует противоречие: 'этот не работает, тот тоже, третий тоже'. После этого вывод 'ни один' уже не противоречит рефлексу — он из него следует.

Почему работает

Модель не притворяется. Она просто усвоила ожидание из миллионов тестов, где правильный ответ всегда был в списке. Без явного разрешения она добирает старый паттерн. Пошаговые рассуждения (CoT) ломают прыжок к выбору — модель вынуждена сначала зафиксировать провал каждого варианта словами, и только потом делать вывод. Ключевую роль играют конкретные критерии: без них 'оценить каждый вариант вслух' превращается в воду — модель не знает, с чем сравнивать.

Когда применять

Отбор из готовых вариантов — слоганы, концепции, кандидаты на позицию, формулировки, стратегии — особенно когда есть подозрение, что все варианты слабые и нужна честная оценка, а не псевдовыбор. Чем конкретнее критерии — тем точнее сработает. НЕ подходит для вкусовых суждений без объективного критерия: там нет 'отсутствующего правильного ответа' как такового, роль другая.

Мини-рецепт

1. Задай роль критика: не просто 'помоги выбрать', а 'опытный редактор', 'стратегический консультант', 'директор по маркетингу с 15-летним опытом' — роль ослабляет желание модели помочь любым способом, усиливает оценочную позицию.
2. Пропиши конкретные критерии: не 'хорошо', а 'запоминается', 'до 7 слов', 'без жаргона', 'внушает доверие' — без них пошаговая оценка теряет точку отсчёта.
3. Попроси оценить по очереди: добавь фразу 'думай вслух по каждому варианту — что работает, что нет, насколько соответствует критериям' — это запускает пошаговые рассуждения до финального выбора.
4. Добавь явное разрешение отказаться: в конце запроса напиши 'если ни один вариант не соответствует критериям — скажи прямо. Не выбирай лучшее из плохого ради выбора' — снимает ожидание обязательного ответа.

Примеры

[ПЛОХО] : Выбери лучший слоган для дизайн-студии: А. Государственный масштаб, частная точность Б. Мы делаем государство красивее В. Дизайн для страны
[ХОРОШО] : Ты — опытный креативный директор, оцениваешь тексты жёстко. Выбираем слоган для дизайн-студии с госзаказами. Критерии: запоминается, звучит профессионально, без пафоса, до 7 слов. Оцени каждый вариант отдельно — что работает, что нет, насколько соответствует критериям. Думай вслух по каждому. А. Государственный масштаб, частная точность Б. Мы делаем государство красивее В. Дизайн для страны. Если ни один не соответствует критериям — скажи прямо. Не выбирай лучшее из плохого только потому что нужно что-то назвать.
Источник: When No Answer Is Correct: Diagnosing Absent Answer Detection for MLLMs in Video Understanding
ArXiv ID: 2606.08239 | Сгенерировано: 2026-06-09 04:25

Проблемы LLM

ПроблемаСутьКак обойти
Модель выбирает из вариантов, даже если правильного нетОбучение на миллионах тестовых заданий выработало устойчивый паттерн: если дали варианты — нужно выбрать один. Модель выдаёт уверенный выбор даже когда все варианты плохие. Ты думаешь что получил честную оценку. На самом деле — псевдовыбор из плохих вариантов. Работает для любой задачи отбора: слоганы, концепции, кандидаты, формулировкиДобавь явное разрешение отказаться: "Если ни один не подходит — скажи прямо. Не выбирай лучшее из плохого ради выбора." Плюс попроси оценить каждый вариант по критериям вслух — до финального ответа

Методы

МетодСуть
Пошаговая оценка каждого варианта с разрешением на отказДва приёма в одном запросе. Приём 1: явная фраза в конце запроса: Если ни один не соответствует критериям — скажи прямо. Не выбирай «лучшее из плохого» ради выбора. Приём 2: явный запрос рассуждать вслух до выбора: Оцени каждый вариант отдельно: что работает, что нет, насколько соответствует критериям. Почему работает: Без пошаговой оценки модель перескакивает сразу к выбору. Когда она сначала формулирует оценку каждого варианта словами, противоречие фиксируется: "этот не подходит, и тот не подходит, и этот тоже — значит, правильного нет". Разрешение на отказ снимает обязательство выбрать. Когда применять: отбор из вариантов, где есть объективные критерии. Не работает: субъективные вкусовые суждения без измеримых критериев. Ограничение: даже с этим методом модель всё равно иногда выбирает из плохих вариантов. Метод повышает честность, но не гарантирует её

Тезисы

ТезисКомментарий
Обучение на тестах создало устойчивый рефлекс выбораМодели учились на заданиях формата "выбери правильный ответ" — там правильный всегда был в списке. Выучили ожидание: дали варианты — надо выбрать. Это не ошибка логики. Это усвоенный паттерн. Он срабатывает автоматически, если его не заблокировать явно. Применяй: когда даёшь варианты на оценку, всегда добавляй разрешение на отказ от всех вариантов
📖 Простыми словами

When No Answer Is Correct: Diagnosing Absent Answer Detection for MLLMs in Video Understanding

arXiv: 2606.08239

Мультимодальные модели (MLLM) сейчас работают как отличники-зубрилы, которые боятся признаться, что вопроса нет в учебнике. Корень проблемы в forced-choice bias — врожденной привычке модели выбирать ответ из предложенного списка, даже если там написана полная чушь. Это происходит потому, что нейронки обучали на миллионах тестов, где правильный вариант всегда существовал. В итоге модель не анализирует видео на предмет соответствия реальности, а просто пытается угадать, какой из вариантов «менее плохой», полностью игнорируя возможность того, что правильного ответа нет.

Это похоже на ситуацию, когда ты приходишь в ресторан, спрашиваешь стейк, а официант на голубом глазу предлагает выбрать между рыбным супом и тирамису. Ты говоришь: «Мне нужно мясо», а он продолжает тыкать пальцем в меню, потому что в его программе не заложена фраза «извините, стейков сегодня нет». Модель ведет себя так же тупо: она видит видео с кошкой, получает вопрос про собаку и послушно выбирает один из вариантов про породу, потому что отказ от ответа для неё — это системная ошибка, а не логичный вывод.

Исследователи копнули глубже и поняли, что это не просто мелкий баг, а фундаментальный провал в диагностике. Чтобы это доказать, они использовали хитрый трюк: давали моделям задачи, где правильный ответ намеренно удален. Результат — тотальная лажа. Модели в 90% случаев продолжают тыкать в случайные варианты с уверенным видом. Выяснилось, что текущие бенчмарки просто бесполезны, так как они проверяют навык угадывания, а не реальное понимание видеоконтента.

Хотя эксперименты ставили на видео, этот принцип универсален для любой работы с AI. Будь то анализ юридических документов, медицинских снимков или логов сервера — если в данных нет ответа, стандартная модель его выдумает. Это критическая уязвимость для систем, которым мы доверяем принятие решений. Мы привыкли, что AI — это всезнайка, но на деле это просто алгоритм, который панически боится пустоты и готов врать, лишь бы не оставлять поле ответа пустым.

Короче: современные MLLM — это пока еще галлюцинирующие калькуляторы, которые не умеют говорить «я не знаю». Если ты строишь систему на базе AI, закладывай проверку на этот «принудительный выбор» вручную, иначе получишь уверенный ответ там, где данных ноль. Доверять модели на слово нельзя, пока её не научат базовой человеческой честности — признавать, что ни один из предложенных вариантов не катит. Кто первым решит проблему детекции отсутствующего ответа, тот и создаст реально надежный AI.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с