3,583 papers
arXiv:2509.01885 83 2 сент. 2025 г. PRO

OPQRST Extraction: извлечение медицинских данных через рассуждения

КЛЮЧЕВАЯ СУТЬ
LLM теряет фокус в многослойных текстах. Задача: «найди когда началась боль в груди» (в документе 3 симптома + 5 дат). Модель видит «боль в груди» в абзаце 1 и «2 недели назад» в абзаце 3 про другой симптом — склеивает их. Причина: не держит иерархию «главная тема → детали этой темы». Метод OPQRST Extraction позволяет извлекать вложенную информацию (деталь, связанную с конкретным контекстом) из документов где много тем одновременно — медкарты, стенограммы созвонов, техподдержка. Фишка: модель не ищет сразу ответ, а идёт по алгоритму из 6 шагов — найди глагол-маркер («жалуется на») → найди проблему («боль в груди») → найди временной маркер для этой проблемы → извлеки фразу → самопроверка → финальный ответ. Галлюцинаций на 8% меньше благодаря шагу самопроверки.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с