arXiv:2505.18059 90 1 мая 2025 г. PRO

Оценка производительности 8 ИИчатботов в извлечении библиографических ссылок: Grok и DeepSeek превосходят.

КЛЮЧЕВАЯ СУТЬ

Исследование показало, что РАЗНЫЕ ЧАТБОТЫ имеют кардинально разную склонность к выдумыванию фактов. Почти 40% ВСЕХ ССЫЛОК оказались фейковыми или содержали грубые ошибки. Grok и DeepSeek показали лучшие результаты, а Copilot, Perplexity и Claude – худшие. Главное открытие: ИИ в 6 РАЗ ЧАЩЕ выдумывает ссылки на научные статьи, чем на книги.

Адаптировать под запрос

Контент доступен только для PRO подписчиков

Чтобы получить доступ к полному содержанию этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

Выберите модель ИИ:

Ваш запрос:

0 / 2000

~0.5-2 N-токенов ~10-30с

~0.3-1 N-токенов ~5-15с

Меню

Оценка производительности 8 ИИчатботов в извлечении библиографических ссылок: Grok и DeepSeek превосходят.

Контент доступен только для PRO подписчиков

Работа с исследованием

Результат адаптации