3,583 papers
arXiv:2511.04573 62 6 нояб. 2025 г. PRO

ARETE: R-пакет для автоматического извлечения информации из текста с использованием больших языковых моделей

КЛЮЧЕВАЯ СУТЬ
Добавление негативных инструкций в промпт увеличивает точность извлечения данных с 60% до 80%+ — это работает потому, что LLM склонна к «творчеству» и включает лишнее, если не запретить явно. Метод ARETE позволяет извлекать структурированные данные из любых текстов (статей, отзывов, отчётов) с точностью профессионального аналитика. Промпт строится как техническая спецификация с четырьмя слоями: жёсткий формат вывода (таблица/список), позитивные правила (что включать), негативные ограничения (что НЕ включать) и детали обработки крайних случаев — F1-score > 0.8 против 0.6 у базового запроса.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с