3,583 papers
arXiv:2606.28044 76 26 июня 2026 г. FREE

Ext-Abs-ToT: трёхшаговое извлечение с оценкой для точных резюме длинных документов

КЛЮЧЕВАЯ СУТЬ
Один запрос на резюме — и модель тянет два несовместимых одеяла одновременно: решает что важно и тут же переформулирует. На длинных документах это заканчивается плохо — середина текста проваливается, ключевые разделы выпадают, а что-то модель просто дописывает от себя. Метод Ext-Abs-ToT позволяет получить резюме длинного структурированного документа, где ни один блок не выпал и ничего не добавлено сверх того, что в тексте реально есть. Фишка: три отдельных запроса — сначала только цитаты, потом только оценка полноты, потом только переписывание проверенного. Каждый шаг — узкая однозначная задача. Модель ищет, а не придумывает.
Адаптировать под запрос

TL;DR

Большинство людей просят модель "сделай саммари" в одном запросе — и получают либо сухой пересказ близкими к оригиналу словами, либо связный текст с выдуманными деталями. Ext-Abs-ToT разбивает суммаризацию на три отдельных шага: сначала вытащи ключевые куски дословно, потом оцени их полноту и достоверность, потом уже перепиши в связный текст.

Проблема одношагового резюме — модель делает две несовместимые вещи одновременно: решает что важно и переформулирует. При этом на длинных документах она "теряет нить" — одни блоки пересказывает подробно, другие сжимает до одного слова или пропускает. Итог: резюме формально есть, но ключевой раздел мог выпасть.

Метод разрывает эти задачи. Шаг 1 — только отбор цитат, без переформулировок. Шаг 2 — только оценка: всё ли охвачено, нет ли дочиненных кусков. Шаг 3 — только переписывание уже проверенного материала в читаемый текст. Три отдельных запроса, каждый с узкой задачей.


🔬

Схема метода

3 отдельных запроса подряд:

ШАГ 1:  Извлечение    → Дословные цитаты по тематическим блокам
ШАГ 2:  Оценка        → Оценки 1–5 по полноте и точности для каждого блока
ШАГ 3:  Синтез        → Связное резюме на основе проверенных фрагментов

🚀

Пример применения

Задача: Изучить договор франшизы сети кофеен (35 страниц) перед встречей с франчайзером. Нужно понять суть: что обязан делать, что запрещено, как расторгнуть.


Шаг 1 — Промпт:

Ты — эксперт по договорному праву. Разбери следующий договор на четыре 
смысловых блока: 
1. Обязательства франчайзи
2. Ограничения и запреты
3. Финансовые условия (роялти, взносы, штрафы)
4. Условия расторжения

Для каждого блока извлеки только самые важные предложения ДОСЛОВНО 
из текста договора. Не перефразируй. Только прямые цитаты.

[ПОЛНЫЙ ТЕКСТ ДОГОВОРА]

Шаг 2 — Промпт:

Оцени извлечённые фрагменты из предыдущего шага.
Для каждого из четырёх блоков поставь оценку от 1 до 5 по двум критериям:
- Полнота: все ли ключевые моменты блока охвачены?
- Точность: все ли фрагменты — прямые цитаты без изменений?

Объясни, чего не хватает в блоках с оценкой ниже 4.

[Вставь результат шага 1]

Шаг 3 — Промпт:

Используя только проверенные фрагменты из предыдущего шага, 
напиши единое связное резюме договора для предпринимателя.

Стиль: деловой, без юридического жаргона. Объём: 300–400 слов.
Органично объедини все четыре блока в цельный текст.
Пиши новыми предложениями — не дословно копируй цитаты.
Сохраняй фактическую точность.

[Вставь результат шага 2]

Результат: Шаг 1 вернёт структурированные цитаты по каждому блоку. Шаг 2 покажет, какие блоки охвачены хорошо, а где модель что-то пропустила — с объяснением. Шаг 3 выдаст связное деловое резюме, написанное новыми предложениями, но опирающееся только на то, что физически есть в документе. Никаких "додумок".


🧠

Почему это работает

Слабость LLM на длинных документах — модель не держит равное внимание ко всему тексту. Начало и конец документа она обрабатывает лучше, середина часто "проваливается". Когда просишь "сделай саммари" одним запросом, модель сама решает что важно — и это решение непредсказуемо.

Сильная сторона LLM — она хорошо справляется с узкими, однозначными задачами. "Найди предложения про штрафы и выпиши дословно" — это чёткая инструкция без простора для интерпретации. Модель ищет, а не придумывает.

Как метод использует это: Шаг 1 убирает соблазн перефразировать — только цитаты. Шаг 2 добавляет явную проверку перед синтезом: если блок получил 2/5 по полноте, ты видишь это до того, как получишь финальный текст. Шаг 3 уже работает с проверенным материалом, а не с сырым документом — и меньше отклоняется.

Рычаги управления: - Список блоков в шаге 1 — главный рычаг: что назовёшь, то и получишь. Добавь блок "риски для покупателя" → получишь цитаты именно про риски - Объём в шаге 3300–400 слов держит резюме коротким; убери ограничение → модель развернёт подробнее - Порог оценки — в шаге 2 можно добавить "перепроверь блоки с оценкой ниже 4" → модель дозаполнит пробелы до финального синтеза - Стиль шага 3 — "деловой без жаргона" / "юридически точный" / "для инвестора за 5 минут" — меняешь один параметр, меняется тон всего резюме


📋

Шаблон промпта

Шаг 1:

Ты — эксперт по {тип документа}. Разбери следующий документ на блоки: 
{блок 1}, {блок 2}, {блок 3}, {блок 4}.

Для каждого блока извлеки только самые важные предложения ДОСЛОВНО 
из текста. Не перефразируй. Только прямые цитаты.

[ПОЛНЫЙ ТЕКСТ ДОКУМЕНТА]

Шаг 2:

Оцени извлечённые фрагменты из предыдущего шага.
Для каждого блока поставь оценку 1–5 по двум критериям:
- Полнота: все ли ключевые моменты охвачены?
- Точность: все ли фрагменты — прямые цитаты без изменений?

Объясни, чего не хватает в блоках с оценкой ниже 4.

[Результат шага 1]

Шаг 3:

Используя только проверенные фрагменты из предыдущего шага,
напиши единое связное резюме.

Стиль: {стиль}. Объём: {число} слов.
Органично объедини все блоки в цельный текст.
Пиши новыми предложениями — не копируй цитаты дословно.
Сохраняй фактическую точность.

[Результат шага 2]

Плейсхолдеры: - {тип документа} — договор, аналитический отчёт, судебное решение, техническое задание - {блок 1–4} — смысловые разделы под твою задачу; для контрактов: обязательства / ограничения / финансы / расторжение; для статьи: проблема / метод / результаты / ограничения - {стиль} — деловой, юридически точный, для неспециалиста, для инвестора - {число} — целевой объём резюме в словах


🚀 Быстрый старт — вставь в чат:

Вот шаблон трёхшагового резюме Ext-Abs-ToT. 
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить все поля.

[вставить шаблон выше]

LLM спросит тип документа, нужные смысловые блоки и желаемый стиль финального резюме — потому что без этого она не знает какую структуру применять к какому тексту.


⚠️

Ограничения

⚠️ Три запроса вместо одного: Метод требует трёх отдельных промптов подряд. Удобнее всего — в одном диалоге последовательно. Для быстрого резюме "на лету" это избыточно.

⚠️ Длинный контекст: Шаги 2 и 3 получают на вход весь output предыдущего шага. На очень длинных документах контекст может разрастаться — следи за лимитами окна модели.

⚠️ Субъективные документы: Метод хорошо работает там, где есть структура и факты — договоры, судебные решения, отчёты. Для творческих текстов или эссе без чёткой структуры — блоки в шаге 1 придётся продумывать тщательнее.

⚠️ Скромный прирост над чистой абстракцией: В исследовании улучшение есть, но небольшое — особенно по метрикам смысловой близости. Главная ценность метода — контролируемость и прозрачность, а не магический прирост качества.


🔍

Как исследовали

Исследователи из IIT Kharagpur и IISER Kolkata взяли 50 пар "юридическое решение → эталонное резюме от юристов-экспертов" из индийской правовой базы. Три типа промптов (чисто извлекающий, чисто переписывающий, гибридный Ext-Abs-ToT) прогнали через DeepSeek-R1 и Llama-3.2 — две модели с большими контекстными окнами, что важно: индийские судебные решения длинные.

Интересная деталь дизайна: эталонные резюме создавали сами юристы — не автоматически, а вручную. Это важно, потому что автоматические метрики типа ROUGE сравнивают слова, а не смысл. Гибридный подход выиграл почти везде — у DeepSeek по четырём из пяти метрик, у Llama по всем пяти. Но выигрыш умеренный: три-пять процентных пунктов, не прорыв.

Логика результата интуитивно понятна: когда модель сначала зафиксировала ключевые куски дословно, у неё меньше пространства для "творчества" в финальном синтезе. Она переписывает проверенное, а не генерирует из памяти. Это особенно важно для юридических и фактических документов, где одно выдуманное слово меняет смысл.


💡

Адаптации и экстраполяции

🔧 Техника: добавить самопроверку в шаг 2 → снизить галлюцинации

В оригинале шаг 2 оценивает полноту и точность, но не просит дополнить пропущенное. Можно добавить: "Для блоков с оценкой ниже 4 — добавь недостающие цитаты из оригинала". Это превращает шаг 2 из диагностики в исправление. Три шага остаются, но шаг 2 становится активным, а не пассивным.

🔧 Техника: применить к структурированию, не только к резюме

Метод работает не только для сжатия. Блоки в шаге 1 можно задать как "Аргументы ЗА / Аргументы ПРОТИВ / Условия / Риски" — и получить не резюме, а аналитическую записку по документу.

Пример: тебе прислали инвестиционное предложение на 20 страниц. Шаг 1 извлекает цитаты про доходность, риски и условия выхода. Шаг 2 проверяет полноту. Шаг 3 выдаёт структурированную аналитику для принятия решения — не пересказ, а разбор.


🔗

Ресурсы

Название работы: A Tree-of-Thoughts Inspired Hybrid Approach for Legal Case Judgement Summarization using LLMs (2026)

Авторы: Aniket Deroy, Kripabandhu Ghosh, Saptarshi Ghosh

Организации: IIT Kharagpur, IISER Kolkata, Индия

Датасет: IN-Ext — 50 индийских судебных решений с экспертными резюме

Метрики оценки: ROUGE-2, ROUGE-L, METEOR, BERTScore, MoverScore

Связанные работы: Tree-of-Thoughts (Yao et al.), SummEval (Yale-LILY)


📋 Дайджест исследования

Ключевая суть

Один запрос на резюме — и модель тянет два несовместимых одеяла одновременно: решает что важно и тут же переформулирует. На длинных документах это заканчивается плохо — середина текста проваливается, ключевые разделы выпадают, а что-то модель просто дописывает от себя. Метод Ext-Abs-ToT позволяет получить резюме длинного структурированного документа, где ни один блок не выпал и ничего не добавлено сверх того, что в тексте реально есть. Фишка: три отдельных запроса — сначала только цитаты, потом только оценка полноты, потом только переписывание проверенного. Каждый шаг — узкая однозначная задача. Модель ищет, а не придумывает.

Принцип работы

Три шага — три разных режима работы модели: Шаг 1: только поиск и дословное извлечение — никакой интерпретации, никаких пересказов. Шаг 2: только оценка — полнота и точность каждого блока по шкале 1–5, с объяснением что пропущено. Видишь дыры ДО финального текста, пока ещё можно исправить. Шаг 3: только переписывание — но не сырого документа, а уже проверенного материала. Модель переформулирует отобранное, а не охотится за смыслами по всему тексту заново. Главный рычаг — список блоков в шаге 1. Что назовёшь, то и получишь. Добавь блок 'риски для покупателя' — придут цитаты именно про риски. Не назовёшь — модель решит сама, и это решение непредсказуемо.

Почему работает

LLM неравномерно работает с длинным текстом. Начало и конец документа обрабатываются лучше, середина проседает — модель теряет нить. Когда просишь 'сделай резюме' одним запросом, она сама расставляет приоритеты. Результат непредсказуем. Узкая задача работает надёжнее широкой: 'найди предложения про штрафы и выпиши дословно' — это команда без простора для интерпретации. Нет простора — нет додумок. Шаг оценки добавляет контрольную точку: блок с оценкой 2/5 виден до синтеза, а не после — когда финальный текст уже выглядит убедительно, но раздел про расторжение там просто отсутствует. Честно про цифры: исследование фиксирует скромный прирост по метрикам смыслового сходства. Главная ценность метода — не магическое улучшение качества, а контроль и прозрачность: ты видишь что извлечено, видишь что оценено, и знаешь на чём построен финальный текст.

Когда применять

Длинные структурированные документы — договоры, судебные решения, аналитические отчёты, технические задания, инвестиционные меморандумы. Особенно когда цена ошибки высокая: пропущенный раздел про штрафы или принятое за реальное 'додуманное' условие. НЕ подходит для быстрого резюме на ходу — три запроса требуют времени и последовательности. Для творческих текстов и эссе без чёткой структуры блоки шага 1 придётся продумывать особенно тщательно, иначе модель не поймёт что искать.

Мини-рецепт

1. Определи смысловые блоки: Реши, какие разделы тебе нужны. Для договора: обязательства / запреты / финансы / расторжение. Для научной статьи: проблема / метод / результаты / ограничения. Это самый важный шаг — структура определяет всё.

2. Первый запрос — только цитаты: Задай роль эксперта, перечисли блоки, попроси извлечь ключевые предложения ДОСЛОВНО без каких-либо переформулировок. Вставь полный текст документа.

3. Второй запрос — только оценка: Попроси оценить каждый блок по шкале 1–5: полнота (все ли ключевые моменты охвачены?) и точность (это прямые цитаты или пересказ?). Попроси объяснить что пропущено в блоках ниже 4. Если хочешь ужесточить — добавь: перепроверь блоки с оценкой ниже 4 и дозаполни перед следующим шагом.

4. Третий запрос — синтез: Дай результат второго шага, укажи стиль ('деловой без жаргона' / 'юридически точный' / 'для неспециалиста') и целевой объём в словах. Модель пишет новыми предложениями, опираясь только на проверенный материал — не на сырой документ.

Примеры

[ПЛОХО] : Сделай краткое резюме этого договора франшизы
[ХОРОШО] — три запроса подряд в одном диалоге: Запрос 1: Ты — эксперт по договорному праву. Разбери договор на четыре блока: 1) обязательства франчайзи, 2) ограничения и запреты, 3) финансовые условия — роялти, взносы, штрафы, 4) условия расторжения. Для каждого блока извлеки важные предложения ДОСЛОВНО из текста. Не перефразируй. Только прямые цитаты. [ТЕКСТ ДОГОВОРА] Запрос 2: Оцени извлечённые фрагменты. Для каждого из четырёх блоков поставь оценку 1–5 по полноте и точности. Объясни чего не хватает в блоках с оценкой ниже 4. [Результат запроса 1] Запрос 3: Используя только проверенные фрагменты, напиши деловое резюме для предпринимателя. Стиль: без юридического жаргона. Объём: 300–400 слов. Пиши новыми предложениями, не копируй цитаты дословно. [Результат запроса 2]
Источник: A Tree-of-Thoughts Inspired Hybrid Approach for Legal Case Judgement Summarization using LLMs
ArXiv ID: 2606.28044 | Сгенерировано: 2026-06-29 05:25

Проблемы LLM

ПроблемаСутьКак обойти
Один запрос на резюме — две несовместимые задачиКогда просишь "сделай саммари", модель одновременно решает что важно и как переформулировать. Это два разных процесса. Под их давлением она неравномерно обрабатывает длинный текст: начало и конец — подробно, середина — сжато или вообще пропускается. Ключевой раздел может выпасть, а знать об этом заранее нельзяРаздели на три отдельных запроса. Сначала только извлечение цитат. Потом только оценка полноты. Потом только переписывание проверенного. Каждый запрос делает одно

Методы

МетодСуть
Три шага: цитаты оценка синтезШаг 1. Попроси выписать дословные цитаты по смысловым блокам. Без переформулировок. "Для каждого блока извлеки только самые важные предложения ДОСЛОВНО. Не перефразируй." Задача узкая — ищет, не придумывает. Шаг 2. Попроси оценить каждый блок числом от 1 до 5 по полноте и точности. "Объясни, чего не хватает в блоках с оценкой ниже 4." Это ворота: видишь пробелы до финального текста. Шаг 3. Попроси написать связный текст на основе проверенных цитат. "Используя только проверенные фрагменты, напиши резюме. Пиши новыми предложениями." Работает с уже проверенным материалом — меньше отклонений. Рычаги: список блоков в шаге 1 определяет что получишь; порог оценки в шаге 2 можно снизить для повторной проверки; стиль в шаге 3 меняет тон всего резюме. Работает: длинные структурированные документы — договоры, отчёты, судебные решения. Не работает: короткие тексты или когда нужен быстрый результат — три запроса избыточны
📖 Простыми словами

A Tree-of-Thoughts Inspired Hybrid Approach for Legal Case Judgement SummarizationusingLLMs

arXiv: 2606.28044

Суть проблемы в том, что когда ты просишь нейронку «сделай саммари» огромного юридического талмуда, она ведет себя как ленивый студент: читает по диагонали начало и конец, а середину просто выдумывает или игнорирует. Это происходит из-за провала внимания в длинном контексте. Модель физически не может удержать в голове 50 страниц текста и одновременно пытаться писать красивый вывод — она либо скатывается в копипасту, либо начинает галлюцинировать, выдавая желаемое за действительное.

Это как если бы ты попросил друга пересказать содержание «Войны и мира», пока он едет на велосипеде по оживленному шоссе. Он либо промямлит пару общих фраз, либо врежется в столб. Метод Ext-Abs-ToT предлагает «остановиться и слезть с велика»: сначала мы заставляем модель просто выписать важные цитаты, потом проверяем их на адекватность, и только в самом конце разрешаем собрать это в связный текст. Формально работы больше, но результат перестает быть лотереей.

В основе лежит гибридная схема из трех шагов. Сначала идет экстрактивная фаза: модель работает как маркер в руках юриста, вытаскивая «мясо» — конкретные пункты о штрафах, сроках и обязательствах без лишних слов. Затем включается Tree-of-Thoughts (ToT) — это фильтр, который оценивает, не потеряли ли мы суть и нет ли в выжимке логических дыр. И только финальный аккорд — абстрактивная суммаризация, где сухие факты превращаются в человеческий текст. Такой подход гарантирует, что в итоговый отчет попадет реальный пункт договора, а не фантазия нейронки о том, как обычно пишутся такие документы.

Хотя метод обкатывали на сложных судебных делах, принцип универсален для любого «тяжелого» контента. Это идеально работает для анализа договоров франшизы, многостраничных технических заданий или медицинских протоколов. Везде, где цена ошибки — это не просто опечатка, а потерянные миллионы или юридический облом, стандартный промпт «сделай кратко» должен быть забыт. SEO-подход к текстам здесь не катит, тут нужна жесткая структура и поэтапная проверка фактов.

Короче: хватит надеяться на «магию» одного запроса, когда речь идет о важных документах. Разделение процесса на добычу фактов, их проверку и финальную сборку — это единственный способ заставить LLM не врать. Ext-Abs-ToT превращает нейронку из сказочника в дотошного аналитика, который сначала думает, а потом говорит. Кто продолжит использовать простые промпты для сложных задач, тот рано или поздно подпишет контракт, в котором мелким шрифтом прописана его капитуляция.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с