arXiv:2605.19932 79 19 мая 2026 г. FREE

PEEK: контекстная карта — ориентационный кэш для повторной работы с большими документами

КЛЮЧЕВАЯ СУТЬ

Парадокс: чтобы не объяснять модели структуру документа заново — люди продолжают старый чат. Это ухудшает результат. История накапливает шум: промежуточные рассуждения, одноразовые выводы, отвергнутые гипотезы. Ориентационное знание («документ — 847 строк, жалобы делятся на 4 категории, даты в DD.MM.YYYY») тонет в этом потоке. PEEK позволяет работать с одним большим документом многократно — не объясняя его структуру с нуля в каждой сессии. Фишка: заведи «записную книжку аналитика» — компактный документ о структуре контекста — и вставляй его в начало каждой новой сессии. Не пересказ содержания — карта навигации. Модель сразу работает, а не тратит первые три итерации на переоткрытие того, что ты уже знаешь.

Адаптировать под запрос

⚡

TL;DR

PEEK — принцип: в начало каждой новой сессии вставляется короткий структурированный документ с ориентационным знанием о большом тексте — что содержит, как организован, какие ключевые сущности и форматы. Не пересказ содержания, а карта навигации. После каждой сессии карта обновляется и сохраняется для следующей.

Главная находка: при повторной работе с одним документом модель каждый раз начинает с нуля — тратит первые итерации на «изучение» структуры заново. История переписки не спасает: она накапливает шум и конкретные выводы прошлых задач, а не структурное понимание контекста. Ориентационное знание («документ содержит 847 строк, жалобы делятся на 4 категории, даты в DD.MM.YYYY») переиспользуется для любой задачи. Задача-специфичное («пользователь спросил про пятницу») — одноразовое. История смешивает оба типа. Карта хранит только первый.

PEEK решает это через контекстную карту — компактный постоянный документ в начале промпта, который обновляется по мере работы. Модель получает «записную книжку аналитика» — всё структурное знание о контексте, накопленное за предыдущие сессии, без шума.

🔬

Схема метода

Два шага, которые повторяются при каждой новой сессии. Каждый шаг — отдельный запрос. Карта живёт вне LLM — в текстовом файле, Notion или заметках.

ШАГ 1 — РАБОЧАЯ СЕССИЯ (каждый раз):
[Карта из прошлой сессии] + [задача] → ответ модели

ШАГ 2 — ОБНОВЛЕНИЕ КАРТЫ (после сессии):
[Карта] + [описание что нашли] → обновлённая карта → сохранить для следующего раза

🚀

Пример применения

Задача: Руководитель сервиса Самоката еженедельно анализирует 200+ отзывов клиентов на Wildberries — ищет паттерны жалоб, тренды по городам, сезонные аномалии. Каждый раз объясняет модели структуру данных заново.

Промпт (Шаг 1 — рабочий запрос):

[КОНТЕКСТНАЯ КАРТА — Отзывы Самокат, Q3 2025]

## Структура данных
CSV, 847 строк. Колонки: дата, город, оценка (1–5), текст отзыва, 
категория жалобы, ID курьера (если указан). Даты — формат DD.MM.YYYY.

## Ключевые сущности
- Города: Москва (61%), СПб (23%), регионы (16%)
- Категории жалоб: «опоздание» (38%), «качество продуктов» (29%), 
  «поведение курьера» (18%), «приложение» (15%)
- Период: 1 июля — 30 сентября 2025

## Известные паттерны
- Жалобы на опоздание растут в пятницу вечером и воскресенье утром
- Молочка и хлеб — лидеры жалоб на качество
- Регионы дают оценки на 0.4 балла ниже при схожих жалобах

## Форматы и ловушки
- ~12% строк без категории жалобы — нужно определять по тексту
- ID курьера есть только в 30% жалоб на поведение

---

Вот новые отзывы за последние 2 недели: [вставить данные]

Задача: найди паттерны, которые не укладываются в известные категории.

Промпт (Шаг 2 — обновление карты):

Ты только что проанализировал отзывы Самоката. 
Вот текущая контекстная карта: [карта выше]

Обнови карту на основе этого анализа:
1. Добавь новые ориентационные находки — то что пригодится для ЛЮБОЙ 
   задачи с этими данными (новые паттерны, уточнения форматов, новые сущности)
2. НЕ добавляй выводы, специфичные для этой задачи
3. Обнови или удали устаревшее
4. Держи карту до 400 слов

Выдай только обновлённую карту в том же формате.

Результат: В Шаге 1 модель сразу переходит к анализу — без трёх итераций на «изучение» структуры. В Шаге 2 выдаст обновлённую карту: скорректированные проценты, новые обнаруженные паттерны, уточнённые форматы. Следующую сессию начнёте уже с обогащённой картой.

🧠

Почему это работает

Слабость LLM: Модель не помнит предыдущие сессии. Каждый новый чат — чистый лист. При работе с одним большим документом она заново «открывает» структуру: где что лежит, как называются поля, какие сущности важны. Это токены и время. Хуже — она может открыть это неправильно.

Почему история переписки не решает: Когда вы продолжаете старый чат, история накапливает шум — конкретные выводы, промежуточные рассуждения, отвергнутые гипотезы. Ориентационное знание в этом потоке теряется. Исследование показало: накопление сырой истории ухудшает качество почти во всех случаях.

Как карта это обходит: Карта хранит только то, что переиспользуется для любой задачи. Не «в прошлый раз пользователь спросил про пятницу», а «жалобы на опоздание растут в пятницу» — это структурное знание о контексте. Модель получает его сразу, без итераций на переоткрытие.

Рычаги управления: - Размер карты → для большинства задач хватает 300–500 слов; больше — сам станет шумом - Частота обновления → обновляй раз в 3–5 сессий, не после каждой - Секции → добавляй под свою задачу: «Реusable Results» (промежуточные вычисления, которые долго пересчитывать), «Domain Constants» (коды, справочники, константы) - Заморозка карты → если документ стабилен, можно остановить обновления и просто переиспользовать карту как есть

📋

Шаблон промпта

Шаблон контекстной карты (Шаг 1):

[КОНТЕКСТНАЯ КАРТА — {название контекста}]

## Структура контекста
{Как организован материал: формат, объём, разделы, вложенность}

## Ключевые сущности
{Важные объекты, их названия, типичные значения, частоты}

## Известные паттерны
{Закономерности, открытые в предыдущих сессиях — чтобы не переоткрывать}

## Форматы и константы
{Форматы дат, единицы измерения, коды, теги, справочные значения}

## Ловушки и исключения
{Пропуски в данных, аномалии, нестандартные случаи}

---
{Задача на эту сессию}

Шаблон обновления карты (Шаг 2):

Вот моя текущая контекстная карта для {название контекста}:
[карта]

Я только что {описание сессии: что анализировал, что обнаружил}.

Обнови карту:
1. Добавь ориентационное знание — то, что пригодится для ЛЮБОЙ задачи с этим контекстом
2. НЕ добавляй выводы, специфичные только для этой задачи
3. Обнови или удали устаревшее
4. Держи карту до {лимит} слов

Выдай только обновлённую карту в том же формате.

Плейсхолдеры: - {название контекста} — «Договор с Ромашкой», «База отзывов Q3», «Документация REST API» - {описание сессии} — коротко что делал в этой сессии и что нашёл - {лимит} — 300–500 слов для большинства задач

🚀 Быстрый старт — вставь в чат:

Вот шаблон контекстной карты (метод PEEK). 
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит о структуре вашего документа, ключевых сущностях и форматах данных — потому что карта должна отражать именно ваш контекст. Она возьмёт паттерн из шаблона и создаст первую версию карты под вашу задачу.

⚠️

Ограничения

⚠️ Одноразовые контексты: Если работаете с документом один раз — карта не нужна. PEEK даёт эффект только при повторных сессиях с одним и тем же контекстом.

⚠️ Ручное ведение: Оригинальная система обновляет карту автоматически. Вручную это требует дисциплины — легко забыть обновить или накопить в карте мусор из задача-специфичных выводов.

⚠️ Граница ориентационное/специфичное размыта: На практике модель иногда добавляет в карту выводы, которые не переиспользуются. Нужно иногда проверять обновления вручную.

⚠️ Быстро меняющийся контекст: Если документ обновляется ежедневно (например, пополняемая база), карта устаревает быстрее, чем успевает накопить ценность.

🔗

Ресурсы

PEEK: Context Map as an Orientation Cache for Long-Context LLM Agents Авторы: Zhuohan Gu, Qizheng Zhang, Omar Khattab, Samuel Madden MIT CSAIL, Stanford University GitHub: github.com/zhuohangu/peek

📋 Дайджест исследования

Ключевая суть

Принцип работы

Всё знание о документе делится на два типа. Первый — ориентационное: где что лежит, как называются поля, какие сущности важны, какие форматы. Это работает для любой задачи с этим документом. Второй — задача-специфичное: что спросил пользователь в прошлый раз, какой вывод сделали про пятницу. Это одноразовое. Прикол: история переписки смешивает оба типа — и ориентационное знание тонет в шуме одноразовых выводов. Карта хранит только первый тип. После каждой сессии — отдельным запросом — обновляешь карту и сохраняешь. Следующая сессия начинается уже с обогащённой версией.

Почему работает

Модель не помнит предыдущие сессии. Каждый новый чат — чистый лист. При повторной работе с большим документом она заново открывает структуру: где что лежит, как называются поля, что важно. Это время и токены впустую. Хуже — она может открыть это неправильно. Жесть: исследование показало — накопление сырой истории переписки ухудшает качество почти во всех случаях. Карта обходит это. Ориентационное знание хранится отдельно, чисто. Передаётся модели напрямую в начало промпта. Без шума из прошлых задач.

Когда применять

Для повторной работы с одним большим контекстом — аналитики разбирают базу отзывов каждую неделю, юристы возвращаются к одному договору несколько раз, разработчики работают с большой кодовой базой или документацией по API. Особенно полезно когда документ стабилен, а задачи меняются от сессии к сессии. НЕ подходит для одноразовой работы с документом — карта даёт эффект только при накоплении знания через несколько сессий.

Мини-рецепт

1. Создай первую карту: спроси модель —

Помоги создать контекстную карту для [название документа]. Задавай вопросы о структуре, ключевых сущностях и форматах.

Дай шаблон из исследования, заполните вместе за один диалог. Лимит — 300–500 слов.

2. Вставляй карту в начало каждой сессии: открываешь новый чат, первым блоком — карта, вторым — задача. Модель сразу ориентируется в контексте без разогрева.

3. После сессии — обновляй карту отдельным запросом:

Вот моя контекстная карта: [карта]. Я только что [описание что делал и что нашёл]. Обнови карту: добавь ориентационное знание — то, что пригодится для любой задачи с этим документом. Не добавляй выводы, специфичные только для сегодняшней задачи. Держи карту до 400 слов.

Сохрани результат в отдельный файл или заметку.

4. Раз в несколько сессий: пробеги по карте глазами — убедись, что туда не просочились одноразовые выводы. Если просочились — удали.

Примеры

[ПЛОХО] : Продолжу старый чат — там уже есть контекст про этот договор.

[ХОРОШО] : Новый чат. Первый блок — карта:

[КОНТЕКСТНАЯ КАРТА — Договор с Ромашкой]

## Структура
Договор поставки, 47 страниц. Разделы: предмет (стр. 1–3), сроки (стр. 4–8), ответственность (стр. 9–15), форс-мажор (стр. 16–19), приложения (стр. 20–47). Приложение 3 — спецификация товаров — ключевое.

## Ключевые сущности
Поставщик: ООО «Ромашка», ИНН 7701234567. Срок поставки: 14 рабочих дней. Штраф за просрочку: 0.1% за день, но не более 10% от суммы партии.

## Ловушки
В разделе 8.3 «рабочие дни» определены иначе — исключают региональные праздники поставщика.

## Известные паттерны
Все ссылки на приложения — через §, не через «приложение».

---
Задача: проверь, покрывает ли раздел об ответственности риски при задержке таможни.

Источник: PEEK: Context Map as an Orientation Cache for Long-Context LLM Agents

ArXiv ID: 2605.19932 | Сгенерировано: 2026-05-20 06:26

Проблемы LLM

Проблема	Суть	Как обойти
Модель переоткрывает структуру документа каждый раз заново	Начинаешь новую сессию с тем же большим документом. Модель не помнит прошлой работы. Снова тратит токены и итерации на «изучение»: где что лежит, как называются поля, какие сущности важны. Это происходит каждый раз, даже если ты работаешь с этим документом сотый раз	Создай структурированный ориентационный документ о контексте. Вставляй его в начало каждой сессии. Модель получает карту сразу — без итераций на переоткрытие
Продолжение старого чата ухудшает качество работы	Интуиция подсказывает: продолжай старый диалог — модель «вспомнит» контекст. Но история накапливает шум: промежуточные рассуждения, отвергнутые гипотезы, выводы прошлых задач. Структурное понимание документа тонет в этом потоке. Чем длиннее история — тем хуже результат на новой задаче	Не копи историю для переиспользования структурного знания. Храни его отдельно — в явном документе вне чата

Методы

Метод	Суть
Контекстная карта — ориентационный документ между сессиями	Создай структурированный документ о своём контексте. Разделы: структура материала, ключевые сущности, известные закономерности, форматы и константы, ловушки. Вставляй в начало каждого нового чата перед задачей. После сессии — отдельным запросом обнови карту новыми находками. Карта живёт вне чата — в текстовом файле, заметках. Почему работает: Модель получает всё структурное знание сразу. Не тратит итерации на переоткрытие. Размер: 300–500 слов — больше становится шумом само. Когда НЕ работает: разовая работа с документом. PEEK даёт эффект только при повторных сессиях с одним контекстом

Метод

Суть

Контекстная карта — ориентационный документ между сессиями

Создай структурированный документ о своём контексте. Разделы: структура материала, ключевые сущности, известные закономерности, форматы и константы, ловушки. Вставляй в начало каждого нового чата перед задачей. После сессии — отдельным запросом обнови карту новыми находками. Карта живёт вне чата — в текстовом файле, заметках. Почему работает: Модель получает всё структурное знание сразу. Не тратит итерации на переоткрытие. Размер: 300–500 слов — больше становится шумом само. Когда НЕ работает: разовая работа с документом. PEEK даёт эффект только при повторных сессиях с одним контекстом

📖 Простыми словами

PEEK: Context Map as an Orientation Cache for Long-ContextLLMAgents

arXiv: 2605.19932

Проблема длинных контекстов в том, что нейронки — это золотые рыбки. Даже если модель способна «проглотить» огромный документ, каждый новый чат для неё начинается с амнезии. Она тратит кучу ресурсов и твоего времени просто на то, чтобы сообразить, как вообще устроены эти данные, где лежат ключи и в каком формате выдавать ответ. Метод PEEK решает это через создание карты ориентации — короткого технического паспорта документа, который вставляется в начало каждой сессии и объясняет модели, куда она вообще попала.

Это как если бы ты каждый день заходил в огромную незнакомую библиотеку без навигации. Вместо того чтобы часами бродить между стеллажами, пытаясь понять, где тут художка, а где справочники, ты берешь в руки индексную карточку. На ней не пересказан сюжет книг, там просто написано: «Стеллаж А — отчеты, Стеллаж Б — жалобы по городам, формат даты — ГГГГ-ММ-ДД». Ты сразу понимаешь структуру пространства и не тупишь у входа, пытаясь вспомнить, что было вчера.

Суть метода в двух простых шагах: сначала отдельный запрос вытаскивает из данных навигационные метаданные (сущности, форматы, структуру), а затем эта «карта» сохраняется в обычном текстовом файле вне чата. Когда ты открываешь новую сессию, ты просто скармливаешь модели этот кэш ориентации. В итоге LLM не гадает, как называются поля в твоей таблице на 2000 строк, а сразу переходит к делу, используя структурированное знание вместо хаотичного поиска по всему массиву текста.

Представь, что ты анализируешь сотни отзывов на Wildberries каждую неделю. Без PEEK тебе пришлось бы каждый раз объяснять модели: «Смотри, тут есть город, дата и категория товара». С этим методом у тебя есть готовый шаблон, который говорит нейронке: «Работай по схеме X, аномалии ищи в колонке Y». Принцип универсален: он одинаково круто работает для анализа кода, юридических контрактов или логов серверов — везде, где структура данных важнее, чем простое «краткое содержание».

Короче, хватит надеяться на память модели — она дырявая по определению. Используй внешний кэш контекста, чтобы превратить каждый новый чат из «первого свидания» в эффективную рабочую планерку. PEEK экономит токены, убирает галлюцинации из-за неверно понятой структуры и заставляет AI работать как профессионального навигатора, а не потерянного туриста. Либо ты даешь модели карту, либо она будет блуждать в трех соснах твоего собственного контента.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

Выберите модель ИИ:

Ваш запрос:

0 / 2000

~0.5-2 N-токенов ~10-30с

~0.3-1 N-токенов ~5-15с

Меню