FirstAidQA: синтетический набор данных для оказания первой помощи и реагирования на чрезвычайные ситуации в условиях низкой связности
КЛЮЧЕВАЯ СУТЬ
Вместо чтения 300-страничного учебника вручную, исследователи обработали его через LLM и получили 5500 готовых пар «вопрос-ответ» — но 12% содержали опасные ошибки. Метод позволяет автоматически извлекать и структурировать знания из больших документов (книги, отчёты, статьи) в нужный формат (FAQ, карточки для запоминания, инсайты из отзывов). Промпт работает как конвейер из 4 шагов: Роль («ты эксперт») → Контекст (фрагмент текста) → Задача («извлеки X») → Формат (JSON/список). Модель перестаёт фантазировать и работает только с данным материалом — точность выше на 40-60%, но критически важна ручная проверка результата.