3,583 papers
arXiv:2505.11368 93 1 мая 2025 г. PRO

GuideBench - Бенчмаркинг - Ориентированные на домен рекомендации для агентов LLM

КЛЮЧЕВАЯ СУТЬ
Вместо того чтобы давать модели общую задачу и надеяться на лучшее, нужно выступать в роли ЗАКОНОДАТЕЛЯ, который предоставляет LLM четкий свод правил для выполнения конкретной работы. Явные, специфичные для домена правила имеют приоритет над встроенными, общими знаниями модели. Это превращает LLM из «творческого помощника со своим мнением» в «исполнительного ассистента», который работает строго по вашему техническому заданию.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с