3,583 papers
arXiv:2606.02875 74 1 июня 2026 г. FREE

Handoff Debt: структурированная передача контекста между сессиями с AI

КЛЮЧЕВАЯ СУТЬ
Каждая смена сессии — это невидимый налог: модель тратит в 2–3 раза больше шагов на восстановление того, что уже было сделано и проверено. Структурированная заметка о передаче контекста позволяет продолжить работу с точки остановки, а не объяснять всё с нуля. Ключевое поле — не «что сделано», а «что провалилось»: именно тупики и неудачные попытки модель-преемник повторяет в первую очередь. Фиксированная структура (что готово / что пробовали / где тупик / что неясно / что проверить) убирает двусмысленность, на разрешение которой иначе уходит половина нового диалога.
Адаптировать под запрос

TL;DR

Когда начинаешь новый чат по незаконченной задаче — модель тратит огромную часть диалога на «раскопки»: что уже сделано, что пробовали, где тупик. Исследование измеряет эту потерю и показывает, что формат передачи контекста влияет на эффективность сильнее, чем кажется.

Главная находка: модель без контекста тратит в 2–3 раза больше шагов на восстановление картины. Причём хуже всего — когда работа уже зашла в тупик и были неудачные попытки: именно тогда модель-преемник больше всего теряет время на повторный «прогон» тех же проверок заново.

Решение — структурированные заметки о передаче: фиксированный шаблон с конкретными полями (что сделано, что проверяли, что не сработало, что неясно, что проверить). Это компактнее, чем вываливать всю историю переписки, но надёжнее, чем пересказывать свободным текстом.


🔬

Схема метода

ШАГ 1 (предшествующий сеанс): Зафиксируй точку остановки →
  Заполни структурированную заметку по шаблону

ШАГ 2 (новый сеанс): Передай заметку модели →
  Попроси проверить статус перед продолжением
  (не слепо доверять, а верифицировать)

Оба шага выполняются в обычном чате, переключение ручное.

🚀

Пример применения

Задача: Ты пишешь питч-дек для своего сервиса доставки еды на тёмных кухнях. Работал с Claude три дня назад, сессия закрылась. Надо продолжить — но не тратить половину нового чата на восстановление контекста.

Промпт:

## Handoff Note — питч-дек для CloudKitchen Урал

**Задача:** Питч-дек для раунда pre-seed, 10 слайдов, инвесторы — фонды Сколково и частные angels из Екб.

**Что уже готово:**
- Слайд 1 (Problem): ✅ финальная версия
- Слайд 2 (Solution): ✅ финальная версия  
- Слайд 3 (Market): ⚠️ черновик, цифры нужно перепроверить (TAM ~18 млрд ₽ — под вопросом)
- Слайды 4–10: ❌ не начаты

**Что пробовали и результат:**
- Пробовали строить Market через Euromonitor — данных по РФ нет, заблокировано
- Нашли альтернативу: данные Data Insight + Nielsen, но не адаптировали под слайд

**Тупики:**
- Слайд 3: непонятно как визуализировать рынок без западных источников
- Конкурентный ландшафт (слайд 5): неясно, включать ли Яндекс Еду как конкурента или партнёра

**Неясности:**
- Тон: инвесторы Сколково хотят «технологический угол», angels — «бизнес-модель». Один питч или два?

**Следующий шаг:** Доделать слайд 3 (Market Size) с российскими источниками.

**Важно проверить до продолжения:**
- Логика TAM/SAM/SOM в слайде 3 корректна ли структурно?

---
Продолжи с этой точки. Сначала проверь: всё ли верно понял по статусу выше? 
Потом предложи конкретный вариант слайда 3.

Результат: Модель начнёт с короткой верификации — подтвердит статус слайдов, обозначит, что именно будет делать. Потом без раскапывания истории предложит Market Size слайд с опорой на российские источники. Тупик с Яндекс Едой зафиксирован — модель не будет его обходить молча, а предложит позицию.


🧠

Почему это работает

Проблема: LLM не помнит прошлые сессии. Когда открываешь новый чат, модель начинает с нуля — и если дать только итоговый файл или исходное задание, она вынуждена повторно прощупывать почву: что было попробовано, что уже решено, почему сделано именно так. Это и есть «долг по передаче» — невидимые потери.

Что умеет модель хорошо: Генерировать по структурированному контексту. Если ей дали чёткие поля — что сделано, что провалилось, что неясно — она мгновенно выстраивает продолжение без повторных проверок. Структура убирает двусмысленность, которую иначе пришлось бы разрешать через дополнительные вопросы.

Почему «просто скопировать переписку» хуже: Полная история — шумная и большая. Модель тратит внимание на фильтрацию. Структурированная заметка по фиксированным полям лучше: компактно, но с нужными деталями. Главное — обязательно включать результаты проверок и тупики, а не только «что сделано». Именно отсутствие информации об ошибках заставляет модель повторять их снова.

Рычаги управления: - Поле «Важно проверить» → убери его, если задача простая и продолжение очевидное; оставь, если была неоднозначность - Поле «Неясности» → чем подробнее заполнишь, тем меньше вопросов получишь в ответ - Инструкция «проверь перед продолжением» → важна: не давай модели слепо доверять своей же заметке, пусть верифицирует


📋

Шаблон промпта

## Handoff Note — {название задачи}

**Задача:** {исходное задание одним абзацем}

**Что уже готово:**
- {элемент 1}: ✅ финально / ⚠️ черновик / ❌ не начат
- {элемент 2}: ...

**Что пробовали и результат:**
- Пробовали: {подход}
- Результат: {сработало / не сработало, почему}

**Тупики и ограничения:**
- {что зашло в тупик или не работает}

**Неясности:**
- {что остаётся открытым вопросом}

**Следующий шаг:** {конкретно что делаем сейчас}

**Важно проверить до продолжения:**
- {что верифицировать}

---
Продолжи с этой точки. Сначала проверь статус по заметке выше — всё ли верно понял?
Потом переходи к следующему шагу.

Плейсхолдеры: - {название задачи} — питч-дек, статья, стратегия, код, контент-план - {элемент} — любая часть работы: слайд, раздел, аргумент, функция - {подход/результат} — что пробовали = конкретно; результат = сработало или нет и почему - {следующий шаг} — одно конкретное действие, не «продолжить работу»


🚀 Быстрый старт — вставь в чат:

Вот шаблон структурированной Handoff Note для передачи контекста между сессиями. 
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит про статус отдельных частей работы, что уже пробовали и где тупики — потому что именно эти поля определяют, с чего начать и чего не повторять.


⚠️

Ограничения

⚠️ Слепое доверие: Если заметка составлена небрежно или с ошибками — модель продолжит в неверном направлении. Всегда проси сначала верифицировать статус, не «слепо доверять» заметке.

⚠️ Задачи без промежуточных состояний: Для коротких задач («напиши письмо», «переведи текст») метод избыточен. Польза растёт с длиной и сложностью работы.

⚠️ Сжатие теряет детали: Если сжать историю свободным текстом (не по структуре) — часть важных деталей выпадает. Структурированные поля надёжнее: они заставляют явно заполнить каждую категорию.

⚠️ Исследовали на кодинг-агентах: Все эксперименты — агент дописывает баги в репозиториях. Для творческих задач с субъективными критериями (дизайн, стратегия) эффект будет, но точных цифр нет.


🔗

Ресурсы

Название: Handoff Debt: The Rediscovery Cost When Coding Agents Take Over Interrupted Tasks

Авторы: Dipesh KC (Independent Researcher), Anjila Budathoki (Georgia State University)

Контакт: kcdipesh429@gmail.com

Базовый бенчмарк: SWE-bench Verified (Jimenez et al., 2024; Chowdhury et al., 2024)

Среда выполнения: OpenHands (Wang et al., 2025)


📋 Дайджест исследования

Ключевая суть

Каждая смена сессии — это невидимый налог: модель тратит в 2–3 раза больше шагов на восстановление того, что уже было сделано и проверено. Структурированная заметка о передаче контекста позволяет продолжить работу с точки остановки, а не объяснять всё с нуля. Ключевое поле — не «что сделано», а «что провалилось»: именно тупики и неудачные попытки модель-преемник повторяет в первую очередь. Фиксированная структура (что готово / что пробовали / где тупик / что неясно / что проверить) убирает двусмысленность, на разрешение которой иначе уходит половина нового диалога.

Принцип работы

Свободный пересказ истории — ненадёжный: часть деталей выпадает, модель тратит внимание на фильтрацию шума. Структура с фиксированными полями работает иначе: она заставляет явно заполнить каждую категорию, включая неудобную — «что не сработало и почему». Модель получает не просто итог работы, а карту: где была, что проверяла, и — главное — куда не ходить. Без этой карты преемник бредёт по тем же граблям.

Почему работает

LLM не помнит прошлые сессии — это факт. Но проблема глубже: когда у модели нет информации о неудачных попытках, она воспроизводит их заново. Самые дорогие шаги — это ре-проверка тупиков, которые уже были пройдены. Структурированный контекст убирает именно это: не «напоминает о результатах», а показывает карту минных полей. Модель не угадывает с нуля — она продолжает по готовой схеме. Плюс явное поле «что проверить до продолжения» не даёт ей слепо принять заметку на веру — страховка от небрежно заполненных полей.

Когда применять

Любая задача с несколькими сессиями: тексты, стратегии, разработка идей, работа с документами — когда работа идёт итерациями через несколько чатов, особенно если были неудачные попытки или открытые вопросы. Польза растёт пропорционально длине и запутанности задачи. НЕ подходит для коротких однозарядных запросов — «напиши письмо», «переведи текст» — там метод избыточен: это молоток для гвоздика размером с задачу на 20 секунд.

Мини-рецепт

1. Остановись до закрытия чата: Потрать 3 минуты на заметку — пока контекст ещё свежий, а не на следующей неделе, когда сам забудешь.
2. Заполни обязательные поля: Что готово (с пометками — финально / черновик / не начато), что пробовали и что получилось, где тупик, что остаётся открытым, конкретный следующий шаг.
3. Не пропускай поле «что не сработало»: Это самое ценное — именно это модель повторит, если не предупредить.
4. Начни новый чат с верификации: Передай заметку и попроси сначала подтвердить, что правильно поняла статус — и только потом переходить к следующему шагу. Это страховка от неверного толкования небрежно заполненных полей.

Примеры

[ПЛОХО] : Мы работали над питч-деком. Нужно доделать слайды про рынок и конкурентов — продолжи.
[ХОРОШО] : ## Handoff Note — питч-дек CloudKitchen Урал Задача: питч-дек для посевного раунда, 10 слайдов, инвесторы — фонды и частные angels. Что готово: - Слайд 1 (Проблема): финальная версия - Слайд 2 (Решение): финальная версия - Слайд 3 (Рынок): черновик, цифры не проверены (TAM ~18 млрд руб — под вопросом) - Слайды 4–10: не начаты Что пробовали и результат: - Euromonitor — данных по РФ нет, заблокировано - Нашли Data Insight + Nielsen, но не адаптировали под слайд Тупики: - Непонятно как визуализировать рынок без западных источников - Яндекс Еда: конкурент или партнёр? Неясности: - Один питч или два под разную аудиторию? Следующий шаг: доделать слайд 3 с российскими источниками. Важно проверить до продолжения: верна ли структура TAM/SAM/SOM в слайде 3? --- Сначала подтверди, что верно понял статус по заметке. Потом переходи к слайду 3.
Источник: Handoff Debt: The Rediscovery Cost When Coding Agents Take Over Interrupted Tasks
ArXiv ID: 2606.02875 | Сгенерировано: 2026-06-03 07:39

Проблемы LLM

ПроблемаСутьКак обойти
В новой сессии модель повторяет уже проверенные тупикиКаждый новый чат — чистый лист. Модель не знает что уже пробовали. Берёт задачу и начинает с тех же проверок что провалились раньше. Особенно дорого это обходится когда работа уже заходила в тупик: модель тратит 2–3 раза больше шагов на «раскопки» вместо движения вперёд. В итоге теряешь время на поиск того, что уже известноЯвно фиксируй что пробовали и почему не сработало. Передавай это в начале новой сессии отдельным блоком. Главное — не только «что готово», но и «что провалилось»: именно это убирает повторные прощупывания

Методы

МетодСуть
Структурированная заметка передачи — возобновление работы без раскопокПеред концом сессии заполни шаблон с фиксированными полями. В начале новой сессии передай его модели и попроси верифицировать — не продолжать сразу, а сначала подтвердить понимание. Поля шаблона: что готово (со статусом ✅/⚠️/❌), что пробовали и что получилось, где тупик, что осталось неясным, конкретный следующий шаг, что проверить перед стартом. Почему работает: Фиксированные поля заставляют явно заполнить каждую категорию. Свободный пересказ — теряет детали. Копия переписки — шумная, модель тратит внимание на фильтрацию. Шаблон компактен, но содержит именно то что нужно для продолжения без потерь. Когда применять: задача длиннее одной сессии, есть промежуточные результаты, работа уже заходила в тупик. Когда избыточно: короткие задачи («напиши письмо», «переведи»), нет истории проб и ошибок
📖 Простыми словами

Handoff Debt: The Rediscovery Cost When CodingAgentsTake Over Interrupted Tasks

arXiv: 2606.02875

Суть проблемы в том, что AI-агенты, как и люди, страдают от «похмелья» при переключении контекста. Когда ты бросаешь задачу на полпути и возвращаешься к ней в новом чате, возникает долг по передаче (Handoff Debt). Модель не просто продолжает писать код, она тратит кучу ресурсов на то, чтобы понять, в какой колее ты застрял, какие костыли уже прикрутил и почему выбрал именно этот путь. Это не просто пауза в работе, а реальные потери эффективности, потому что нейронка начинает заново изобретать велосипед, который ты уже выбросил на помойку два часа назад.

Это как если бы ты делал ремонт, ушел на обед, а вместо тебя пришла другая бригада. Им мало увидеть голые стены — им нужно знать, где идет проводка, почему вы штробили именно здесь и какой клей купили для плитки. Если ты просто скажешь "доделывайте", они потратят полдня на то, чтобы расковырять твои швы и понять, что там внутри. В итоге работа стоит, деньги капают, а результат — сплошное недоразумение, потому что новые мастера не в курсе твоих гениальных планов.

Исследователи замерили этот хаос и выяснили, что стоимость переоткрытия задачи напрямую зависит от того, как ты «сдаешь смену». Если просто кинуть модели финальный файл, она будет тупить и совершать те же ошибки, что и ты в начале. Чтобы минимизировать Handoff Debt, нужно передавать не только результат, но и траекторию поиска: что пробовали, где возник тупик и какие варианты были отвергнуты. Только так модель перестает гадать на кофейной гуще и сразу включается в работу, экономя до трети времени на пустые «раскопки».

Принцип универсален: он работает не только в кодинге, но и в маркетинге, дизайне или написании текстов. Будь то создание питч-дека для стартапа или настройка рекламы, любая прерванная сессия с ChatGPT или Claude превращается в тыкву, если ты не умеешь правильно передавать контекст. Мы привыкли думать, что AI всемогущ, но без истории твоих факапов и промежуточных идей он просто высокотехнологичный гадальщик, который за твой счет пытается угадать, что же было в прошлой серии.

Короче: хватит надеяться на «память» моделей или краткие вводные. Если хочешь, чтобы AI реально помогал, а не заставлял тебя по десять раз объяснять одно и то же, фиксируй логику процесса, а не только итог. Долг по передаче — это налог на твою лень при составлении промпта. Либо ты тратишь две минуты на нормальное резюме текущего статуса, либо сливаешь часы на то, чтобы модель перестала тупить в простых вещах. Кто научится закрывать этот долг быстро, тот и выжмет из агентов максимум.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с