3,583 papers
arXiv:2503.15990 82 1 мар. 2025 г. PRO

ECKGBench - Бенчмаркинг крупных языковых моделей в электронной коммерции с использованием графа знаний

КЛЮЧЕВАЯ СУТЬ
LLM значительно лучше справляются с "общими" знаниями (например, "микроволновка нужна для разогрева еды"), чем с "абстрактными" (например, "оттенок 'облачно-белый' похож на 'молочно-белый'"), что указывает на фундаментальные ограничения в понимании моделью тонких взаимосвязей.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с