SNOW: мультиагентная система для извлечения медицинских признаков из текста
КЛЮЧЕВАЯ СУТЬ
Проблема: Ручное извлечение признаков из текста — год работы на 147 документов. Автоматические модели (BERT, embeddings) — быстро, но хуже базовых методов. LLM с промптами — хорошо, но эксперт всё равно нужен чтобы сказать ЧТО искать.
SNOW (Scalable Note-to-Outcome Workflow) позволяет извлекать структурированные признаки из неструктурированного текста полностью автономно — без участия экспертов. Первая система, которая сравнялась с ручной работой врачей.
Фишка: разбивает монолитную задачу на конвейер из 5 специализированных агентов. Один находит какие признаки нужны, второй извлекает значения, третий проверяет качество, четвёртый трансформирует данные, пятый генерирует код для агрегации. Если валидация нашла ошибки — система возвращается назад с улучшенными инструкциями. AUC 0.761 против 0.771 у экспертов (базовые методы — 0.691).