3,583 papers
arXiv:2506.20642 85 1 июня 2025 г. FREE

Мементо: заметки для вашего будущего я

КЛЮЧЕВАЯ СУТЬ
Разделение задачи на планирование, пошаговое извлечение фактов во внешнюю память и финальный синтез резко повышает точность LLM в решении комплексных задач, где требуется соединить информацию из нескольких источников.
Адаптировать под запрос
📌

1. Ключевые аспекты исследования:

Исследование предлагает метод "Memento", который решает сложные многоходовые вопросы путем их декомпозиции на три этапа. Сначала LLM создает план рассуждений в виде логических шагов. Затем, для каждого шага, LLM используется как инструмент для поиска конкретных фактов, которые записываются в структурированную "базу памяти". Наконец, итоговый ответ выводится путем логического запроса к этой базе, что значительно надежнее, чем попытка удержать все шаги в "уме" модели.

Ключевой результат: Разделение задачи на планирование, пошаговое извлечение фактов во внешнюю память и финальный синтез резко повышает точность LLM в решении комплексных задач, где требуется соединить информацию из нескольких источников.

🔬

2. Объяснение всей сути метода:

Суть метода "Memento" для обычного пользователя заключается в том, чтобы перестать рассматривать LLM как всезнающего гения и начать относиться к нему как к очень умному, но крайне забывчивому ассистенту. У него плохая "оперативная память". Если вы дадите ему сложную задачу, требующую учесть 5-7 разных фактов и зависимостей, он, скорее всего, запутается, "забудет" начальные условия к концу рассуждения и начнет галлюцинировать.

Метод Memento, адаптированный для чата, предлагает следующий воркфлоу:

  1. Фаза 1: Планирование. Не просите сразу решить задачу. Сначала попросите LLM составить план ее решения. Ваш первый промпт должен быть о создании "дорожной карты".

    • Пример: "Не отвечай пока на вопрос. Сначала составь пошаговый план, как мы найдем ответ на вопрос '...'".
  2. Фаза 2: Пошаговое "строительство памяти". Теперь вы, пользователь, выступаете в роли "ведущего". Вы берете каждый пункт плана и задаете LLM отдельный, сфокусированный вопрос. Ответы LLM на эти мини-запросы становятся вашими "фактами", вашей внешней "памятью" в истории чата.

    • Пример: "Отлично, давай по плану. Шаг 1: [текст первого шага из плана]. Найди информацию по этому пункту". Получив ответ, вы продолжаете: "Хорошо. Теперь Шаг 2: [текст второго шага]...".
  3. Фаза 3: Финальный синтез. Когда вы прошли по всем шагам плана и собрали все необходимые "факты" в чате, вы делаете финальный запрос. В нем вы просите LLM решить исходную задачу, но с важным ограничением: использовать только ту информацию, которую вы собрали на предыдущих шагах. Это заставляет модель опираться на проверенные данные, а не на свою внутреннюю "память" или галлюцинации.

Таким образом, вы вручную симулируете процесс, предложенный в исследовании: вы заставляете LLM сначала спланировать, потом по частям собрать факты, а затем сделать вывод на основе этих конкретных фактов, а не на абстрактных рассуждениях.

📌

3. Анализ практической применимости:

*Прямая применимость:Низкая. Пользователь не может запустить Prolog-интерпретатор в окне чат-бота. Однако, как описано выше, логику метода можно полностью воспроизвести вручную через серию промптов, что делает еекосвенно очень применимой.

  • Концептуальная ценность: Огромная. Исследование дает пользователю ключевое понимание: когнитивная нагрузка — враг LLM. Сложные задачи нужно дробить не только потому, что так проще, а потому что это обходит фундаментальное ограничение архитектуры. LLM хорошо генерирует план и хорошо отвечает на простые вопросы, но плохо делает и то, и другое одновременно в рамках одного запроса.

  • Потенциал для адаптации: Максимальный. Механизм адаптации заключается в том, чтобы пользователь взял на себя роль "координатора", который управляет процессом Memento. Вместо автоматизированной системы с базой данных Prolog, пользователь использует историю чата как "базу фактов" и последовательность своих промптов — как "исполнитель" плана. Это превращает монолог (один большой промпт) в управляемый диалог.


🚀

4. Практически пример применения:

Задача: Спланировать бюджетный уикенд в Санкт-Петербурге для семьи с двумя детьми (7 и 12 лет), интересующихся историей и наукой.

Промпт (адаптированный Memento-подход, пошаговый диалог):

ШАГ 1: ПЛАНИРОВАНИЕ

Привет! Мне нужна твоя помощь в планировании поездки. Но не составляй пока сам маршрут.
**Задача:** Разработать детальный **план исследования** для организации 3-дневной поездки в Санкт-Петербург для семьи с двумя детьми (7 и 12 лет).
**Интересы:** История, наука, интерактивные музеи.
**Бюджет:** Относительно бюджетный.

**Твоя задача сейчас:**
Создай пошаговый план из 4-5 пунктов, по которым мы должны собрать информацию, чтобы в итоге составить идеальный маршрут. План должен быть в виде нумерованного списка.

(...допустим, LLM вернул план: 1. Подобрать 5-6 музеев. 2. Найти варианты недорогого питания. 3. Предложить 2-3 бесплатных активности. 4. Сравнить варианты транспорта.)

ШАГ 2: СБОР ФАКТОВ (выполняем план)

Отличный план! Давай начнем с пункта 1.
**Инструкция:**
Опираясь на наши интересы (история, наука) и возраст детей (7 и 12), предложи 5-6 подходящих музеев или активностей в Санкт-Петербурге. Для каждого варианта кратко укажи, почему он будет интересен, и примерную стоимость входного билета на семью.
(...LLM дает список: Гранд Макет Россия, Музей оптики, Планетарий №1, Зоологический музей и т.д...)

ШАГ 3: ФИНАЛЬНЫЙ СИНТЕЗ

Спасибо, мы собрали всю нужную информацию. Теперь твоя финальная задача.
**Контекст (наша "база фактов"):**
- **Музеи:** Гранд Макет Россия, Музей оптики, Планетарий №1, Зоологический музей.
- **Питание:** Сеть столовых "Тарелка", "Теремок".
- **Бесплатные активности:** Прогулка по Летнему саду, осмотр крейсера "Аврора" снаружи.
- **Транспорт:** Метро - самый бюджетный вариант.

**Инструкция:**
Составь подробный пошаговый маршрут на 3 дня (Пятница, Суббота, Воскресенье). Используй **ТОЛЬКО** информацию из предоставленного выше контекста. Распредели активности по дням так, чтобы это было логично с точки зрения географии и не слишком утомительно для детей. Укажи примерное время на каждую активность.

🧠

5. Почему это работает:

Этот промпт работает, потому что он полностью воспроизводит логику Memento, снимая с LLM когнитивную нагрузку:

  1. Декомпозиция: Вместо одного гигантского запроса "спланируй мне всё", мы разбиваем задачу на логические части: "сначала придумай план", "потом найди музеи", "затем составь маршрут".
  2. Внешняя память: История чата и явно предоставленный контекст в последнем промпте (Контекст (наша "база фактов")) играют роль той самой "базы данных Prolog". Модели не нужно вспоминать, что она советовала ранее, — вся информация перед ней.
  3. Сфокусированное исполнение: Каждый промежуточный промпт имеет одну, очень конкретную цель (найти музеи, найти кафе). Это позволяет LLM выдать более точный и релевантный ответ на каждом шаге.
  4. Снижение галлюцинаций: Финальная инструкция Используй ТОЛЬКО информацию из предоставленного выше контекста — это ключевая часть метода. Она заставляет модель работать в режиме "синтезатора данных", а не "свободного художника", что резко снижает вероятность выдумывания несуществующих мест или нерелевантных активностей.

📌

6. Другой пример практического применения

Задача: Написать продающий пост для Instagram о новом фитнес-батончике.

Промпт (адаптированный Memento-подход, пошаговый диалог):

ШАГ 1: ПЛАНИРОВАНИЕ

Мне нужно написать продающий пост для Instagram. Перед тем, как писать сам текст, давай составим план.
**Продукт:** Веганский протеиновый батончик "Энергия+" с натуральными ингредиентами.
**Целевая аудитория:** Молодые люди 20-35 лет, ведущие активный образ жизни, занимаются спортом, следят за питанием.

**Твоя задача:**
Предложи структуру продающего поста из 4-х ключевых блоков (например: заголовок, проблема, решение, призыв к действию). Опиши кратко, что должно быть в каждом блоке.

ШАГ 2: СБОР "ФАКТОВ" / ГЕНЕРАЦИЯ КОМПОНЕНТОВ

Отличная структура. Теперь давай наполним каждый блок. Работай по пунктам.
1. **Заголовок:** Придумай 3 варианта ярких, цепляющих заголовков для поста, которые привлекут внимание нашей аудитории.
2. **Проблема:** Напиши 2-3 предложения, описывающие типичную проблему нашей аудитории (например, "трудно найти полезный перекус после тренировки без сахара и химии").
3. **Решение:** Сформулируй 3 ключевых преимущества батончика "Энергия+". Используй формат буллетов.
4. **Призыв к действию (CTA):** Напиши 2 варианта четких призывов к действию (например, "закажи по ссылке в профиле").

ШАГ 3: ФИНАЛЬНЫЙ СИНТЕЗ

Супер, у нас есть все компоненты. Теперь собери из них готовый пост.
**Инструкция:**
Напиши целостный текст для поста в Instagram. Используй следующие части, которые мы сгенерировали ранее. Можешь их немного стилистически отредактировать, чтобы они плавно перетекали друг в друга.

- **Выбери лучший заголовок из трех предложенных.**
- **Используй описание проблемы.**
- **Вставь список преимуществ.**
- **Заверши пост одним из призывов к действию.**
- **Добавь 5-7 релевантных хэштегов.**
🧠

7. Объяснение механизма почему этот пример работает.

Этот пример работает по тем же принципам, что и предыдущий, но в творческой, а не аналитической задаче.

  1. Управляемый креатив: Вместо того чтобы просить "напиши креативный пост" (что часто ведет к шаблонным результатам), мы декомпозируем творческий процесс. Мы заставляем LLM отдельно сфокусироваться на каждой части: заголовке, проблеме, решении. Это позволяет получить более качественные "кирпичики" для будущего текста.
  2. Снижение нагрузки на выбор: Генерируя несколько вариантов для каждого блока (3 заголовка, 2 CTA), мы используем LLM для "мозгового штурма". На финальном этапе, когда модель собирает пост, она (или пользователь) может выбрать лучшие из уже готовых частей.
  3. Структурный контроль: План, созданный на первом шаге, служит "скелетом" для будущего текста. Это гарантирует, что пост будет иметь логичную продающую структуру, а не будет просто набором красивых фраз. Финальный промпт заставляет модель заполнить эту структуру уже одобренными и качественными элементами, что приводит к предсказуемо хорошему результату.

📌

Основные критерии оценки

  • A. Релевантность техникам промтинга: Да, исследование предлагает мета-стратегию (план -> пошаговое извлечение фактов -> синтез), которую можно адаптировать для написания промптов.
  • B. Улучшение качества ответов: Да, исследование демонстрирует значительное улучшение в решении сложных, многоходовых вопросов (multi-hop QA).
  • C. Прямая практическая применимость: Низкая в чистом виде (требуется Prolog и автоматизация), но очень высокая в адаптированном виде для ручного использования в чате.
  • D. Концептуальная ценность: Очень высокая. Идеально объясняет слабость LLM в удержании контекста и многошаговых рассуждениях, давая пользователю мощную ментальную модель "Планируй, потом действуй по шагам".
  • E. Новая полезная практика (кластеры):
    • Кластер 1 (Техники формулирования): Является продвинутой формой декомпозиции и Chain-of-Thought.
    • Кластер 6 (Контекст и память): Вся суть метода — создание внешней, структурированной "памяти" для LLM.
    • Кластер 7 (Надежность и стабильность): Метод напрямую нацелен на снижение ошибок в сложных рассуждениях.
  • Чек-лист практичности (+15 баллов): Да, исследование показывает, как структурировать сложные запросы, раскрывает неочевидные особенности поведения LLM (хороший планировщик, но плохой исполнитель в одном лице) и предлагает способ улучшить точность.
📌

2 Цифровая оценка полезности

Аргументы за оценку 85: Исследование представляет фундаментально важную идею для любого пользователя LLM: декомпозиция сложной задачи на "планирование" и "исполнение" — это не просто хороший тон, а способ обойти ключевое ограничение моделей. Аналогия с главным героем фильма "Memento", который оставляет себе заметки, чтобы справиться с потерей кратковременной памяти, — это идеальная ментальная модель для пользователя. Она объясняет, почему LLM "забывает" детали в середине длинного ответа или путается в сложных инструкциях.

Хотя прямой перенос метода с использованием Prolog невозможен для обычного пользователя, адаптация этой логики к диалогу в чате дает немедленный и ощутимый результат. Пользователь, понявший суть Memento, перестает писать гигантские монолитные промпты и переходит к более эффективному, пошаговому диалогу с LLM, что кардинально повышает качество результатов.

Контраргументы:

* Почему оценка могла быть выше (90+): Концептуальная ценность настолько высока, что она может изменить сам подход пользователя к взаимодействию с LLM навсегда. Это не просто "техника", а целая "философия" промптинга для сложных задач.
* Почему оценка могла быть ниже (65-70): Прямая реализация метода требует технических навыков и инструментов, недоступных рядовому пользователю. Если оценивать только то, что можно скопировать и вставить в чат "как есть", то польза минимальна. Работа требует от пользователя осмысления и адаптации, а не простого применения готовых фраз.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с