3,583 papers
arXiv:2505.18059 90 1 мая 2025 г. PRO

Оценка производительности 8 ИИчатботов в извлечении библиографических ссылок: Grok и DeepSeek превосходят.

КЛЮЧЕВАЯ СУТЬ
Исследование показало, что РАЗНЫЕ ЧАТБОТЫ имеют кардинально разную склонность к выдумыванию фактов. Почти 40% ВСЕХ ССЫЛОК оказались фейковыми или содержали грубые ошибки. Grok и DeepSeek показали лучшие результаты, а Copilot, Perplexity и Claude – худшие. Главное открытие: ИИ в 6 РАЗ ЧАЩЕ выдумывает ссылки на научные статьи, чем на книги.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с