3,583 papers
arXiv:2506.00319 88 1 июня 2025 г. PRO

SkillVerse - Оценка и улучшение LLM с помощью оценки дерева

КЛЮЧЕВАЯ СУТЬ
Вместо общей оценки "ответ плохой", разбивай неудачи на АТОМАРНЫЕ ПРОБЛЕМЫ - конкретные навыки, которые модель провалила или освоила. Строй карту навыков своей LLM, выявляя паттерны: где она сильна (креатив, анализ), где слаба (форматирование, строгие правила). Используй знание о СЛЕПЫХ ЗОНАХ для усиления промптов в проблемных областях.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с