3,583 papers
arXiv:2606.21359 74 19 июня 2026 г. PRO

SCIFACTCHECK: специализированные «научные» LLM галлюцинируют чаще обычных — и звучат при этом увереннее

КЛЮЧЕВАЯ СУТЬ
Парадокс: чем «научнее» модель, тем хуже она говорит о науке. Модели, дообученные на научных статьях, галлюцинируют чаще GPT-4o и Claude — и при этом звучат увереннее. Промпт с явным запросом хеджирующего языка и запретом на цитаты переключает модель из режима «уверенного эксперта» в режим «честного собеседника». Фишка: дообучение учит стилю научного письма — но не знаниям. Модель буквально «чувствует» неуверенность внутри (низкая вероятность предсказания токенов), но пишет так, будто знает точно.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с