TL;DR
Когда модель итерирует задачу и заходит в тупик — помогает не больше попыток и не вся история чужого опыта, а один конкретный пример лучшего результата. Показ модели полной истории всех предыдущих попыток (своих или чужих) часто не помогает или активно вредит — модель теряется в шуме. Показ единственного топового примера или даже простого сигнала "этот вариант набрал 9/10" работает лучше, чем весь контекст разом.
Главная находка: "Больше контекста = лучше" — неверное допущение. Когда ты итеративно улучшаешь текст/идею и вставляешь в чат все предыдущие версии, модель получает полный журнал — включая слабые варианты, тупики и повторения. Это не помогает отличить паттерн победителя от паттерна неудачника. Модель скользит по всему корпусу, а не концентрируется на лучшем.
Исследование сравнило пять форматов подачи "чужого опыта": полная история, только рейтинг/оценки, один лучший пример, сжатое резюме, и ничего. Один лучший пример (Top-1 trace) и сигнал рейтинга (только оценка без деталей) стабильно превосходили полную историю. Сжатое резюме проигрывало — слишком абстрактное, нет конкретики для действия.
Схема принципа
(Это не промпт-техника с фиксированными шагами — это принцип подачи контекста при итерации)
КОГДА: задача требует нескольких раундов улучшений (текст, идеи, планы)
СТАНДАРТНЫЙ ПОДХОД — не работает эффективно:
[Попытка 1] → [Попытка 2] → [Попытка 3] → "улучши это"
→ Модель получает весь шум, включая неудачи
ПРИНЦИП ИЗ SAGE — работает лучше:
Шаг 1: Найди ОДИН лучший внешний пример → вставь его целиком
ИЛИ
Шаг 1: Дай сигнал качества без деталей → "вот лучший вариант, он набрал 9/10 по критериям X"
Шаг 2: Дай свою задачу → "сделай так же / лучше"
Оба шага — в одном сообщении.
Пример применения
Задача: Ты пишешь описание своего Telegram-канала для спонсоров — того, кто рекламирует у тебя. Три раза переделывал с Claude, выходит всё тот же унылый "контент-маркетинг для предпринимателей". Нужно выбиться из шаблона.
Промпт:
Вот пример описания канала, которое реально цепляет спонсоров —
я видел его у [Александра Горного / Ильи Красинского / другого человека
на слуху], оно набирало отклики в 3-4 раза выше среднего по рынку:
---
[Вставляешь ОДИН конкретный пример описания, который тебе нравится —
из чужого медиа-кита, открытого питча, телеграм-поста]
---
Моя аудитория: [описание]. Моя тема: [описание].
Напиши описание для спонсорского медиа-кита в похожей логике —
конкретно, без "экосистем" и "синергий".
Результат: Модель берёт структуру и тон конкретного примера и применяет к твоей теме. Ты не получаешь "улучшенный вариант попытки №3" — ты получаешь вариант, скалиброванный по настоящему работающему образцу. Разница как между "сделай лучше это" и "сделай как вот то, только про моё".
Почему это работает
Слабость LLM при итерации: Когда ты говоришь "улучши" и вставляешь все предыдущие версии, модель видит всю историю попыток разом. Она не знает, что из этого было хорошим шагом, а что — тупиком. Нет метки "это правильное направление". Модель усредняет.
Сильная сторона LLM: Модель отлично работает с явными примерами. Если ей показать один конкретный образец с пометкой "это работает" — она извлекает паттерн и переносит на новый контекст. Это то, что в исследовании называют абстракцией переносимого знания.
Как принцип использует это: Вместо "вот весь мой путь к хорошему результату" — "вот сам хороший результат". Модель не тратит ресурс на фильтрацию плохих примеров. Она сразу работает с эталоном. Один сильный образец даёт больше сигнала, чем десять средних.
Рычаги управления: - Качество примера → чем точнее пример твоей задачи, тем лучше перенос. Пример из смежной ниши — работает хуже, но всё равно лучше чем без примера - Пояснение почему пример хорош → добавь "особенно цепляет X" — модель усилит именно это - Сигнал без деталей → если нет хорошего примера, попробуй: "Критерий успеха — [конкретная метрика], лучший вариант из тех, что я видел, набирал 9/10. Ориентируйся на эту планку"
Шаблон промпта
Вот пример {тип контента}, который работает отлично —
{откуда/почему он хорош: набрал X, понравился Y, решил задачу Z}:
---
{Полный текст одного лучшего примера}
---
Моя задача: {что нужно создать}
Мой контекст: {аудитория, тема, ограничения}
Сделай по похожей логике, но под мой контекст.
Сохрани: {что именно из примера нужно сохранить — тон/структуру/подход}
Измени: {что точно не подходит — терминология, стиль, детали}
Плейсхолдеры:
- {тип контента} — описание канала / питч / письмо / пост / оффер
- {откуда/почему хорош} — источник и сигнал качества, даже если простой
- {Полный текст} — вставляй целиком, не сжимай
- {что сохранить/изменить} — чем точнее, тем лучше перенос
🚀 Быстрый старт — вставь в чат:
Помоги применить принцип из SAGE: вместо всех моих прошлых версий
покажу тебе один хороший внешний пример и попрошу сделать так же.
Моя задача: [твоя задача]
[вставить шаблон выше]
LLM спросит про твой контекст, аудиторию и что именно из примера нужно перенести — потому что без этого перенос будет поверхностным.
Ограничения
⚠️ Если ты уже делаешь хорошо: Принцип работает для тех, кто застрял. Если твои итерации и так улучшаются — внешний пример может увести в чужой стиль. Исследование показало: сильнейший агент от чужого опыта не выигрывал, иногда проигрывал.
⚠️ Слишком сжатое резюме не поможет: "Хороший пример — это лаконичный, живой, с конкретикой" — слишком абстрактно. Нужен сам текст, не описание его свойств. Резюме без деталей не даёт модели паттерна для копирования.
⚠️ Зависит от задачи: В открытых творческих задачах (исследование, нестандартный формат) чужой пример помогает меньше — там хорошая саморефлексия и итерация уже дают высокий результат. Лучший эффект — в задачах со стратегией и конкретными критериями (оферы, презентации, переговорные письма).
⚠️ Конкурентные задачи — отдельная история: В конкурентной среде (анализ конкурентов, переговоры) модель учится бороться с конкретным оппонентом, но если оппонент меняется — преимущество исчезает. Не переоценивай перенос.
Ресурсы
Название: SAGE: A Quantitative Evaluation of Socialized Evolution in Agent Ecosystems
Авторы: Linyue Pan (Tsinghua University), Yaoming Zhu, Lin Qiu, Xuezhi Cao, Xunliang Cai (Meituan, China)
Арены: MLR-Bench, DrugWars, Splendor — три среды для проверки кооперативного и конкурентного обучения агентов
Связанные работы: Reflexion (Shinn et al., 2023), Self-Refine (Madaan et al., 2023), Generative Agents (Park et al., 2023)
