TL;DR
Большинство людей просят модель "сделай саммари" в одном запросе — и получают либо сухой пересказ близкими к оригиналу словами, либо связный текст с выдуманными деталями. Ext-Abs-ToT разбивает суммаризацию на три отдельных шага: сначала вытащи ключевые куски дословно, потом оцени их полноту и достоверность, потом уже перепиши в связный текст.
Проблема одношагового резюме — модель делает две несовместимые вещи одновременно: решает что важно и переформулирует. При этом на длинных документах она "теряет нить" — одни блоки пересказывает подробно, другие сжимает до одного слова или пропускает. Итог: резюме формально есть, но ключевой раздел мог выпасть.
Метод разрывает эти задачи. Шаг 1 — только отбор цитат, без переформулировок. Шаг 2 — только оценка: всё ли охвачено, нет ли дочиненных кусков. Шаг 3 — только переписывание уже проверенного материала в читаемый текст. Три отдельных запроса, каждый с узкой задачей.
Схема метода
3 отдельных запроса подряд:
ШАГ 1: Извлечение → Дословные цитаты по тематическим блокам
ШАГ 2: Оценка → Оценки 1–5 по полноте и точности для каждого блока
ШАГ 3: Синтез → Связное резюме на основе проверенных фрагментов
Пример применения
Задача: Изучить договор франшизы сети кофеен (35 страниц) перед встречей с франчайзером. Нужно понять суть: что обязан делать, что запрещено, как расторгнуть.
Шаг 1 — Промпт:
Ты — эксперт по договорному праву. Разбери следующий договор на четыре
смысловых блока:
1. Обязательства франчайзи
2. Ограничения и запреты
3. Финансовые условия (роялти, взносы, штрафы)
4. Условия расторжения
Для каждого блока извлеки только самые важные предложения ДОСЛОВНО
из текста договора. Не перефразируй. Только прямые цитаты.
[ПОЛНЫЙ ТЕКСТ ДОГОВОРА]
Шаг 2 — Промпт:
Оцени извлечённые фрагменты из предыдущего шага.
Для каждого из четырёх блоков поставь оценку от 1 до 5 по двум критериям:
- Полнота: все ли ключевые моменты блока охвачены?
- Точность: все ли фрагменты — прямые цитаты без изменений?
Объясни, чего не хватает в блоках с оценкой ниже 4.
[Вставь результат шага 1]
Шаг 3 — Промпт:
Используя только проверенные фрагменты из предыдущего шага,
напиши единое связное резюме договора для предпринимателя.
Стиль: деловой, без юридического жаргона. Объём: 300–400 слов.
Органично объедини все четыре блока в цельный текст.
Пиши новыми предложениями — не дословно копируй цитаты.
Сохраняй фактическую точность.
[Вставь результат шага 2]
Результат: Шаг 1 вернёт структурированные цитаты по каждому блоку. Шаг 2 покажет, какие блоки охвачены хорошо, а где модель что-то пропустила — с объяснением. Шаг 3 выдаст связное деловое резюме, написанное новыми предложениями, но опирающееся только на то, что физически есть в документе. Никаких "додумок".
Почему это работает
Слабость LLM на длинных документах — модель не держит равное внимание ко всему тексту. Начало и конец документа она обрабатывает лучше, середина часто "проваливается". Когда просишь "сделай саммари" одним запросом, модель сама решает что важно — и это решение непредсказуемо.
Сильная сторона LLM — она хорошо справляется с узкими, однозначными задачами. "Найди предложения про штрафы и выпиши дословно" — это чёткая инструкция без простора для интерпретации. Модель ищет, а не придумывает.
Как метод использует это: Шаг 1 убирает соблазн перефразировать — только цитаты. Шаг 2 добавляет явную проверку перед синтезом: если блок получил 2/5 по полноте, ты видишь это до того, как получишь финальный текст. Шаг 3 уже работает с проверенным материалом, а не с сырым документом — и меньше отклоняется.
Рычаги управления:
- Список блоков в шаге 1 — главный рычаг: что назовёшь, то и получишь. Добавь блок "риски для покупателя" → получишь цитаты именно про риски
- Объём в шаге 3 — 300–400 слов держит резюме коротким; убери ограничение → модель развернёт подробнее
- Порог оценки — в шаге 2 можно добавить "перепроверь блоки с оценкой ниже 4" → модель дозаполнит пробелы до финального синтеза
- Стиль шага 3 — "деловой без жаргона" / "юридически точный" / "для инвестора за 5 минут" — меняешь один параметр, меняется тон всего резюме
Шаблон промпта
Шаг 1:
Ты — эксперт по {тип документа}. Разбери следующий документ на блоки:
{блок 1}, {блок 2}, {блок 3}, {блок 4}.
Для каждого блока извлеки только самые важные предложения ДОСЛОВНО
из текста. Не перефразируй. Только прямые цитаты.
[ПОЛНЫЙ ТЕКСТ ДОКУМЕНТА]
Шаг 2:
Оцени извлечённые фрагменты из предыдущего шага.
Для каждого блока поставь оценку 1–5 по двум критериям:
- Полнота: все ли ключевые моменты охвачены?
- Точность: все ли фрагменты — прямые цитаты без изменений?
Объясни, чего не хватает в блоках с оценкой ниже 4.
[Результат шага 1]
Шаг 3:
Используя только проверенные фрагменты из предыдущего шага,
напиши единое связное резюме.
Стиль: {стиль}. Объём: {число} слов.
Органично объедини все блоки в цельный текст.
Пиши новыми предложениями — не копируй цитаты дословно.
Сохраняй фактическую точность.
[Результат шага 2]
Плейсхолдеры:
- {тип документа} — договор, аналитический отчёт, судебное решение, техническое задание
- {блок 1–4} — смысловые разделы под твою задачу; для контрактов: обязательства / ограничения / финансы / расторжение; для статьи: проблема / метод / результаты / ограничения
- {стиль} — деловой, юридически точный, для неспециалиста, для инвестора
- {число} — целевой объём резюме в словах
🚀 Быстрый старт — вставь в чат:
Вот шаблон трёхшагового резюме Ext-Abs-ToT.
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить все поля.
[вставить шаблон выше]
LLM спросит тип документа, нужные смысловые блоки и желаемый стиль финального резюме — потому что без этого она не знает какую структуру применять к какому тексту.
Ограничения
⚠️ Три запроса вместо одного: Метод требует трёх отдельных промптов подряд. Удобнее всего — в одном диалоге последовательно. Для быстрого резюме "на лету" это избыточно.
⚠️ Длинный контекст: Шаги 2 и 3 получают на вход весь output предыдущего шага. На очень длинных документах контекст может разрастаться — следи за лимитами окна модели.
⚠️ Субъективные документы: Метод хорошо работает там, где есть структура и факты — договоры, судебные решения, отчёты. Для творческих текстов или эссе без чёткой структуры — блоки в шаге 1 придётся продумывать тщательнее.
⚠️ Скромный прирост над чистой абстракцией: В исследовании улучшение есть, но небольшое — особенно по метрикам смысловой близости. Главная ценность метода — контролируемость и прозрачность, а не магический прирост качества.
Как исследовали
Исследователи из IIT Kharagpur и IISER Kolkata взяли 50 пар "юридическое решение → эталонное резюме от юристов-экспертов" из индийской правовой базы. Три типа промптов (чисто извлекающий, чисто переписывающий, гибридный Ext-Abs-ToT) прогнали через DeepSeek-R1 и Llama-3.2 — две модели с большими контекстными окнами, что важно: индийские судебные решения длинные.
Интересная деталь дизайна: эталонные резюме создавали сами юристы — не автоматически, а вручную. Это важно, потому что автоматические метрики типа ROUGE сравнивают слова, а не смысл. Гибридный подход выиграл почти везде — у DeepSeek по четырём из пяти метрик, у Llama по всем пяти. Но выигрыш умеренный: три-пять процентных пунктов, не прорыв.
Логика результата интуитивно понятна: когда модель сначала зафиксировала ключевые куски дословно, у неё меньше пространства для "творчества" в финальном синтезе. Она переписывает проверенное, а не генерирует из памяти. Это особенно важно для юридических и фактических документов, где одно выдуманное слово меняет смысл.
Адаптации и экстраполяции
🔧 Техника: добавить самопроверку в шаг 2 → снизить галлюцинации
В оригинале шаг 2 оценивает полноту и точность, но не просит дополнить пропущенное. Можно добавить: "Для блоков с оценкой ниже 4 — добавь недостающие цитаты из оригинала". Это превращает шаг 2 из диагностики в исправление. Три шага остаются, но шаг 2 становится активным, а не пассивным.
🔧 Техника: применить к структурированию, не только к резюме
Метод работает не только для сжатия. Блоки в шаге 1 можно задать как "Аргументы ЗА / Аргументы ПРОТИВ / Условия / Риски" — и получить не резюме, а аналитическую записку по документу.
Пример: тебе прислали инвестиционное предложение на 20 страниц. Шаг 1 извлекает цитаты про доходность, риски и условия выхода. Шаг 2 проверяет полноту. Шаг 3 выдаёт структурированную аналитику для принятия решения — не пересказ, а разбор.
Ресурсы
Название работы: A Tree-of-Thoughts Inspired Hybrid Approach for Legal Case Judgement Summarization using LLMs (2026)
Авторы: Aniket Deroy, Kripabandhu Ghosh, Saptarshi Ghosh
Организации: IIT Kharagpur, IISER Kolkata, Индия
Датасет: IN-Ext — 50 индийских судебных решений с экспертными резюме
Метрики оценки: ROUGE-2, ROUGE-L, METEOR, BERTScore, MoverScore
Связанные работы: Tree-of-Thoughts (Yao et al.), SummEval (Yale-LILY)
