3,583 papers
arXiv:2511.07685 63 10 нояб. 2025 г. PRO

ResearchRubrics: эталон запросов и рубрик для оценки глубоких исследовательских агентов

КЛЮЧЕВАЯ СУТЬ
Даже топовые LLM-агенты от Google и OpenAI проваливают 30-40% задач, требующих синтеза информации из разных источников и понимания невысказанных требований. Метод Rubric-Driven Prompting позволяет компенсировать эти слабости через встраивание критериев оценки прямо в текст запроса. Вместо «расскажи про X» пользователь пишет «проанализируй X по критериям: 1. [аспект], 2. [аспект], 3. [аспект], затем сделай вывод» — модель перестает угадывать ожидания и начинает следовать четкой структуре оценки, что даёт сбалансированный анализ вместо поверхностного ответа.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с