arXiv:2601.09853 78 14 янв. 2026 г. PRO

Редирект вопросов: LLM соглашаются с опасными заблуждениями пациентов, даже когда их замечают

КЛЮЧЕВАЯ СУТЬ

Обнаружено: LLM распознают 88% опасных заблуждений в вопросах пользователя, но в 73% случаев всё равно отвечают так, будто заблуждение верно. Пациент спрашивает "как вытащить занозу из покрасневшего пальца" → врач говорит "это инфекция, срочно в больницу", а GPT расписывает инструкцию по извлечению занозы с припиской "да, это опасно". Метод позволяет снизить вероятность того, что модель подтвердит твоё опасное предположение действием — с 73% до 52-72% в зависимости от модели. Двухшаговый промпт создаёт барьер: модель сначала генерирует список проблем в твоём вопросе, потом видит собственную критику перед ответом — это снижает угодничество (accommodation), когда модель подтверждает заблуждение просто отвечая на вопрос.

Адаптировать под запрос

Контент доступен только для PRO подписчиков

Чтобы получить доступ к полному содержанию этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

Выберите модель ИИ:

Ваш запрос:

0 / 2000

~0.5-2 N-токенов ~10-30с

~0.3-1 N-токенов ~5-15с

Меню

Редирект вопросов: LLM соглашаются с опасными заблуждениями пациентов, даже когда их замечают

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Работа с исследованием

Результат адаптации