TL;DR
Когда начинаешь новый чат по незаконченной задаче — модель тратит огромную часть диалога на «раскопки»: что уже сделано, что пробовали, где тупик. Исследование измеряет эту потерю и показывает, что формат передачи контекста влияет на эффективность сильнее, чем кажется.
Главная находка: модель без контекста тратит в 2–3 раза больше шагов на восстановление картины. Причём хуже всего — когда работа уже зашла в тупик и были неудачные попытки: именно тогда модель-преемник больше всего теряет время на повторный «прогон» тех же проверок заново.
Решение — структурированные заметки о передаче: фиксированный шаблон с конкретными полями (что сделано, что проверяли, что не сработало, что неясно, что проверить). Это компактнее, чем вываливать всю историю переписки, но надёжнее, чем пересказывать свободным текстом.
Схема метода
ШАГ 1 (предшествующий сеанс): Зафиксируй точку остановки →
Заполни структурированную заметку по шаблону
ШАГ 2 (новый сеанс): Передай заметку модели →
Попроси проверить статус перед продолжением
(не слепо доверять, а верифицировать)
Оба шага выполняются в обычном чате, переключение ручное.
Пример применения
Задача: Ты пишешь питч-дек для своего сервиса доставки еды на тёмных кухнях. Работал с Claude три дня назад, сессия закрылась. Надо продолжить — но не тратить половину нового чата на восстановление контекста.
Промпт:
## Handoff Note — питч-дек для CloudKitchen Урал
**Задача:** Питч-дек для раунда pre-seed, 10 слайдов, инвесторы — фонды Сколково и частные angels из Екб.
**Что уже готово:**
- Слайд 1 (Problem): ✅ финальная версия
- Слайд 2 (Solution): ✅ финальная версия
- Слайд 3 (Market): ⚠️ черновик, цифры нужно перепроверить (TAM ~18 млрд ₽ — под вопросом)
- Слайды 4–10: ❌ не начаты
**Что пробовали и результат:**
- Пробовали строить Market через Euromonitor — данных по РФ нет, заблокировано
- Нашли альтернативу: данные Data Insight + Nielsen, но не адаптировали под слайд
**Тупики:**
- Слайд 3: непонятно как визуализировать рынок без западных источников
- Конкурентный ландшафт (слайд 5): неясно, включать ли Яндекс Еду как конкурента или партнёра
**Неясности:**
- Тон: инвесторы Сколково хотят «технологический угол», angels — «бизнес-модель». Один питч или два?
**Следующий шаг:** Доделать слайд 3 (Market Size) с российскими источниками.
**Важно проверить до продолжения:**
- Логика TAM/SAM/SOM в слайде 3 корректна ли структурно?
---
Продолжи с этой точки. Сначала проверь: всё ли верно понял по статусу выше?
Потом предложи конкретный вариант слайда 3.
Результат: Модель начнёт с короткой верификации — подтвердит статус слайдов, обозначит, что именно будет делать. Потом без раскапывания истории предложит Market Size слайд с опорой на российские источники. Тупик с Яндекс Едой зафиксирован — модель не будет его обходить молча, а предложит позицию.
Почему это работает
Проблема: LLM не помнит прошлые сессии. Когда открываешь новый чат, модель начинает с нуля — и если дать только итоговый файл или исходное задание, она вынуждена повторно прощупывать почву: что было попробовано, что уже решено, почему сделано именно так. Это и есть «долг по передаче» — невидимые потери.
Что умеет модель хорошо: Генерировать по структурированному контексту. Если ей дали чёткие поля — что сделано, что провалилось, что неясно — она мгновенно выстраивает продолжение без повторных проверок. Структура убирает двусмысленность, которую иначе пришлось бы разрешать через дополнительные вопросы.
Почему «просто скопировать переписку» хуже: Полная история — шумная и большая. Модель тратит внимание на фильтрацию. Структурированная заметка по фиксированным полям лучше: компактно, но с нужными деталями. Главное — обязательно включать результаты проверок и тупики, а не только «что сделано». Именно отсутствие информации об ошибках заставляет модель повторять их снова.
Рычаги управления: - Поле «Важно проверить» → убери его, если задача простая и продолжение очевидное; оставь, если была неоднозначность - Поле «Неясности» → чем подробнее заполнишь, тем меньше вопросов получишь в ответ - Инструкция «проверь перед продолжением» → важна: не давай модели слепо доверять своей же заметке, пусть верифицирует
Шаблон промпта
## Handoff Note — {название задачи}
**Задача:** {исходное задание одним абзацем}
**Что уже готово:**
- {элемент 1}: ✅ финально / ⚠️ черновик / ❌ не начат
- {элемент 2}: ...
**Что пробовали и результат:**
- Пробовали: {подход}
- Результат: {сработало / не сработало, почему}
**Тупики и ограничения:**
- {что зашло в тупик или не работает}
**Неясности:**
- {что остаётся открытым вопросом}
**Следующий шаг:** {конкретно что делаем сейчас}
**Важно проверить до продолжения:**
- {что верифицировать}
---
Продолжи с этой точки. Сначала проверь статус по заметке выше — всё ли верно понял?
Потом переходи к следующему шагу.
Плейсхолдеры:
- {название задачи} — питч-дек, статья, стратегия, код, контент-план
- {элемент} — любая часть работы: слайд, раздел, аргумент, функция
- {подход/результат} — что пробовали = конкретно; результат = сработало или нет и почему
- {следующий шаг} — одно конкретное действие, не «продолжить работу»
🚀 Быстрый старт — вставь в чат:
Вот шаблон структурированной Handoff Note для передачи контекста между сессиями.
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.
[вставить шаблон выше]
LLM спросит про статус отдельных частей работы, что уже пробовали и где тупики — потому что именно эти поля определяют, с чего начать и чего не повторять.
Ограничения
⚠️ Слепое доверие: Если заметка составлена небрежно или с ошибками — модель продолжит в неверном направлении. Всегда проси сначала верифицировать статус, не «слепо доверять» заметке.
⚠️ Задачи без промежуточных состояний: Для коротких задач («напиши письмо», «переведи текст») метод избыточен. Польза растёт с длиной и сложностью работы.
⚠️ Сжатие теряет детали: Если сжать историю свободным текстом (не по структуре) — часть важных деталей выпадает. Структурированные поля надёжнее: они заставляют явно заполнить каждую категорию.
⚠️ Исследовали на кодинг-агентах: Все эксперименты — агент дописывает баги в репозиториях. Для творческих задач с субъективными критериями (дизайн, стратегия) эффект будет, но точных цифр нет.
Ресурсы
Название: Handoff Debt: The Rediscovery Cost When Coding Agents Take Over Interrupted Tasks
Авторы: Dipesh KC (Independent Researcher), Anjila Budathoki (Georgia State University)
Контакт: kcdipesh429@gmail.com
Базовый бенчмарк: SWE-bench Verified (Jimenez et al., 2024; Chowdhury et al., 2024)
Среда выполнения: OpenHands (Wang et al., 2025)
