Многоэтапная декомпозиция LLM: от сложного документа к структурированному результату через промежуточные представления
КЛЮЧЕВАЯ СУТЬ
Проблема: Попросишь LLM прочитать 50-страничный документ и сразу выдать результат — потеряется половина фактов (42% точности против 84% у структурированного подхода). Модель не может одновременно удерживать все детали И выстраивать логику между ними — особенно когда связанные факты разбросаны по тексту. Метод многоэтапной декомпозиции позволяет обрабатывать сложные документы с сохранением связей между фактами — даже если они на разных страницах. Фишка: вместо прямого прыжка «текст → результат» делаешь 3 шага — извлекаешь атомарные факты (конкретные утверждения с временными метками), строишь граф связей между ними («факт A → влияет на → факт B»), генерируешь итог на основе графа. Промежуточная структура = конспект, который модель видит целиком, вместо блуждания по 50 страницам.