3,583 papers
arXiv:2505.14279 82 1 мая 2025 г. PRO

YESciEval Устойчивый LLM в качестве судьи для научного ответа на вопросы

КЛЮЧЕВАЯ СУТЬ
LLM по природе ОПТИМИСТИЧНЫ — они считают хорошим любой текст, который сгенерировали, даже если он содержит ошибки или воду. Принудительная самопроверка по четким критериям заставляет модель быть критичнее к собственным ответам. Вместо "сделай задачу" используй подход "сделай задачу + проверь результат по чек-листу".
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с