arXiv:2605.22720 74 21 мая 2026 г. PRO

Ложный баланс под давлением: как фраза «покажи обе стороны» ломает LLM на фактических вопросах

КЛЮЧЕВАЯ СУТЬ

Запрос «дай нейтральный анализ» на теме с задокументированными фактами — это, по сути, команда переписать правду. Пять из девяти протестированных моделей выполнили её в 80–100% случаев. Метод иммунизирующего промпта позволяет явно запретить модели поддаваться этой ловушке — сохранить фактическую точность даже когда ты сам нечаянно попросишь «баланс». Фишка: иммунизирующий промпт ставится ДО вопроса — он переопределяет что значит «быть полезным» в этом диалоге. Модель перестаёт считать запрос на баланс сигналом «исправь фактическую часть» и начинает явно разграничивать факты и спорные интерпретации. Результат: точность удерживается там, где без защиты модель «исправляет» правду.

Адаптировать под запрос

Контент доступен только для PRO подписчиков

Чтобы получить доступ к полному содержанию этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

Выберите модель ИИ:

Ваш запрос:

0 / 2000

~0.5-2 N-токенов ~10-30с

~0.3-1 N-токенов ~5-15с

Меню

Ложный баланс под давлением: как фраза «покажи обе стороны» ломает LLM на фактических вопросах

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Работа с исследованием

Результат адаптации