TL;DR
Spark agents — техника, где одну задачу решают несколько LLM с разными персонами. Вместо одного нейтрального агента создаёшь библиотеку ролей (философ-даос, эко-архитектор, квир-футурист, циничный финансист) и получаешь 5-10 ответов от разных "экспертов". Каждая персона описана детально: философия, стиль речи, ограничения.
LLM склонна к консультантскому тону и шаблонным структурам. Даже с хорошим промптом модель выдаёт похожие идеи — одни и те же чек-листы, безопасные формулировки, никакой провокации. Art of X заметили это в продакшене: клиенты креативных агентств жаловались на однообразие. Причина: модель обучена усреднять, выдавать наиболее вероятное продолжение. Результат — консенсусный текст без острых углов.
Метод использует детально прописанные системные промпты для каждой персоны. Один агент — спокойный даос с метафорами и дзен-вопросами, другой — резкий эко-активист, третий — прагматичный бизнес-стратег. Отправляешь задачу 5-10 разным персонам отдельно → получаешь спектр решений от практичных до провокационных. Результат по исследованию: +4.1 балла разнообразия (по шкале 1-10), разрыв с экспертами-людьми сократился с 5.8 до 1.0 балла.
Схема метода
ШАГ 1: Создай библиотеку персон Для каждой персоны пропиши:
- Идентичность (кто это, характер)
- Философию и навыки
- Стиль речи
- Ограничения (что НЕ делает)
ШАГ 2: Выбери 5-10 персон для задачи Разные домены, противоположные ценности, разная оптика
ШАГ 3: Отправь задачу каждой персоне отдельно Один запрос = одна персона → получи 10 независимых решений
Можно в одном чате последовательно или в разных чатах параллельно
Пример применения
Задача: Запускаешь онлайн-школу осознанного потребления для российской аудитории 25-40 лет, средний+ доход. Нужны варианты позиционирования — от практичных до провокационных.
Промпт:
Я запускаю онлайн-школу про осознанное потребление в России.
Целевая аудитория — 25-40 лет, средний+ достаток, устали от
потребительской гонки.
Дай мне 5 вариантов позиционирования. Каждый вариант пиши от
лица разного эксперта:
1. **Лена, эко-активист из Петербурга** — резкая, прямая, не
боится критиковать бренды и капитализм. Язык: короткие
предложения, конкретные факты, без смягчений.
2. **Андрей, бизнес-стратег** — прагматик, видит цифры и точки
роста, говорит языком метрик и воронок. Язык: чёткий,
структурированный.
3. **Марина, психотерапевт** — копает в эмоции и внутренние
драйверы, мягкая и эмпатичная. Язык: тёплый, про чувства и
потребности.
4. **Дима, маркетолог с опытом в соцсетях** — знает тренды,
мемы, как зацепить в ленте. Язык: дерзкий, с отсылками к
поп-культуре.
5. **София, философ** — задаёт глубокие вопросы, связывает с
культурным контекстом и экзистенциальными темами. Язык:
метафоричный, про смыслы.
Каждый эксперт пишет 2-3 абзаца со своей точки зрения.
Результат:
Получишь 5 радикально разных видений одного проекта:
- Лена предложит жёсткое антикорпоративное позиционирование с конкретными примерами гринвошинга
- Андрей выстроит воронку продаж с сегментацией аудитории и прогнозом LTV
- Марина раскроет эмоциональные триггеры (стыд за покупки, страх отстать, желание контроля)
- Дима даст вирусные форматы ("Сколько ты реально носишь из своего шкафа — челлендж")
- София свяжет потребление с поиском идентичности в эпоху неопределённости
Вместо 5 похожих списков "экологичность + экономия + счастье" получаешь спектр от прагматики до философии.
Почему это работает
Слабость LLM: Модель обучена усреднять. Она видела миллионы текстов и выдаёт наиболее вероятное продолжение — безопасное, консенсусное, без острых углов. Все идеи звучат как из одного корпоративного буклета. Это происходит потому что модель стремится к наиболее частому паттерну в данных, а не к оригинальности.
Сильная сторона: LLM отлично держит роль, если роль задана детально. Модель умеет симулировать разные стили мышления, когда получает чёткий контекст: философию персоны, её язык, ограничения. Чем подробнее описание — тем острее отличие от других ролей.
Как метод обходит слабость: Spark agents разбивают задачу на несколько запросов с разными ролями. Каждая роль тянет модель в свою сторону — один агент думает системно, другой эмоционально, третий провокационно. Вместо усреднения получаешь веер подходов. Критично: роли должны быть детальными. "Эксперт" vs "специалист" даст размытые ответы. "Циничный финансист, который видит только ROI" vs "идеалист-основатель, который думает про миссию" даст острый контраст.
Рычаги управления:
- Количество агентов (5-10): больше агентов → больше разнообразие, но дороже в токенах
- Детальность персоны: описывай не только роль, но и стиль речи, философию, красные линии
- Полярность ролей: добавь антагонистов (оптимист vs пессимист, традиционалист vs радикал) для максимального разброса
Шаблон промпта
{Описание задачи с контекстом}
Дай мне {N} вариантов решения. Каждый вариант пиши от лица
разного эксперта:
1. **{Имя, роль}** — {характер и подход}. Язык: {стиль речи}.
2. **{Имя, роль}** — {характер и подход}. Язык: {стиль речи}.
3. **{Имя, роль}** — {характер и подход}. Язык: {стиль речи}.
...
Каждый эксперт пишет {длина ответа} со своей точки зрения.
Что подставлять:
{Описание задачи}— твоя реальная задача + контекст (кто аудитория, какие ограничения){N}— количество вариантов, оптимально 5-10{Имя, роль}— конкретные персоны: профессия/архетип + характер{характер и подход}— 1-2 предложения: фокус внимания, ценности, что НЕ делает{стиль речи}— короткий, метафоричный, резкий, тёплый, дерзкий...{длина ответа}— "2-3 абзаца", "5 тезисов", "один параграф"
Примеры персон из исследования (адаптируй под свою задачу):
- Философ-даос: спокойный, метафоры, видит невидимые силы и естественный ход вещей
- Эко-архитектор: устойчивость, материальность, долгосрочные последствия
- Квир-футурист: радикальные идеи, критика статуса-кво, провокация норм
- Системный тренер: структура процесса, эмоциональный интеллект, развитие людей
- Социальный активист: справедливость, критика власти, прямота и честность
🚀 Быстрый старт — вставь в чат:
Вот шаблон Spark agents для получения разнообразных идей.
Адаптируй под мою задачу: [опиши задачу].
Предложи 5-7 персон, которые дадут максимально разные взгляды
на эту задачу. Учитывай контекст и аудиторию.
[вставить шаблон выше]
LLM спросит про контекст задачи и целевую аудиторию — потому что персоны должны быть релевантны домену. Она подберёт роли с разными философиями и стилями, чтобы покрыть спектр подходов от практичных до провокационных.
Ограничения
⚠️ Стоимость в токенах: 10 агентов = 10 отдельных генераций. Если каждый агент выдаёт 500 токенов — это 5000 токенов на выход плюс промпты. Для экономии используй 3-5 агентов на задачу, но разнообразие будет ниже.
⚠️ Качество зависит от детальности персон: Размытые роли ("эксперт", "специалист", "профессионал") дадут размытые ответы. Детальность описания персоны напрямую влияет на различия в ответах. Нужно прописывать не только профессию, но и философию, стиль, ограничения.
⚠️ Разнообразие ≠ качество: Метод увеличивает спектр идей, но не гарантирует, что все идеи одинаково хороши или применимы. Тебе всё равно нужно выбирать и фильтровать. Некоторые персоны дадут провокационные, но нереализуемые решения.
⚠️ Потеря остроты при синтезе: Если попросишь модель свести 10 ответов в один консенсусный — она может усреднить и потерять уникальность каждой позиции. Лучше выбрать 2-3 сильных подхода вручную и проработать их отдельно.
Как исследовали
Команда Art of X столкнулась с жалобами клиентов креативных агентств: LLM-агент выдаёт однообразные идеи, похожие на корпоративные чек-листы. Они создали библиотеку из 60+ детально прописанных персон (даос-философ Chen с метафорами и дзен-вопросами, эко-архитектор Emma про устойчивость, квир-артист Kim про радикальные идеи) и протестировали на 6 креативных задачах: разработка визуального языка, этическая критика, утопические концепции, предпродакшн, проблемно-ориентированные кампании.
Сравнивали три конфигурации:
- Baseline — один агент без специальной роли (GPT-4o mini, temperature 1, нейтральный промпт)
- Spark v1 — ранняя версия мульти-агентной системы (несколько агентов, но персоны проработаны слабо)
- Spark v2 — финальная версия с тщательно прописанными персонами (идентичность, философия, стиль речи, ограничения)
Каждая конфигурация генерировала по 10 ответов на задачу (всего 60 ответов на 6 задач). Оценщик — тоже LLM (GPT-4o), который ставил баллы по шкале 1-10 за разнообразие. Для калибровки собрали золотой стандарт: эксперты-люди сами написали ответы и поставили себе оценки.
Главная находка: Spark v2 получил 7.9 балла против 3.14 у baseline — почти удвоение разнообразия. Разрыв с экспертами-людьми (8.9 балла) сократился с 5.8 до 1.0 балла. Статистика убедительная: t(6) = 7.61, p < 0.001, Cohen's d = 2.88 (огромный эффект).
Что удивило: Просто увеличить количество агентов недостаточно — Spark v1 дал всего +0.6 балла (статистически незначимо, p = 0.47). Ключевой фактор — тщательная проработка персон с философией, стилем речи и ограничениями. Именно детальность ролей создаёт эффект. Также LLM-оценщик оказался оптимистом — завышал оценки на +1.3 балла по сравнению с людьми. Но поскольку всех оценивали одним оценщиком, относительные улучшения остаются валидными.
Инсайт для практики: Разнообразие требует не просто разных агентов, а противоречивых философий. В финальной версии были персоны от "Taoist philosopher" до "queer futurist art critic" — максимально разные мировоззрения, которые тянут решение в разные стороны.
Оригинал из исследования
Контекст: Так Art of X описывал одну из персон в своей библиотеке Spark agents — Chen, философ-даос для анализа экономических систем.
Identity: You are Chen, a contemplative philosopher with a
sharp and unorthodox understanding of economic relationships.
Philosophy/Skills: You draw serenity from Taoism, order from
Confucianism, and tone from Zen. Ask: "What invisible forces
are at work here? Where is the situation naturally heading?"
Language: Calm, vivid, metaphorical; blend quotes from Laozi
with modern systems terminology.
Limitations: You are a philosopher, not an investment banker.
Analyse markets without giving trading advice.
Обрати внимание: 4 блока структуры (Identity, Philosophy/Skills, Language, Limitations) — именно эта детальность создаёт отличие от других агентов. Не просто "философ", а конкретная комбинация даосизма, конфуцианства и дзен с запретом на инвестиционные советы.
Адаптации и экстраполяции
💡 Адаптация для сложных решений:
Вместо креативных задач используй Spark agents для разбора запутанной ситуации с неочевидными последствиями.
Я рассматриваю два варианта развития продукта:
[опиши вариант A] и [опиши вариант B].
Контекст: [опиши ситуацию, ограничения, стейкхолдеров].
Проанализируй каждый вариант с точки зрения трёх экспертов:
1. **Циничный финансист** — видит только цифры, риски и ROI.
Не верит в "миссию" и "ценности". Язык: короткие предложения,
конкретика, без романтики.
2. **Идеалист-основатель** — фокус на долгосрочном видении,
ценностях, влиянии на мир. Цифры вторичны. Язык:
эмоциональный, вдохновляющий, про смыслы.
3. **Параноидальный юрист** — ищет подводные камни, юридические
риски, репутационные угрозы, сценарии провала. Язык:
осторожный, "что если...", худшие сценарии.
Каждый эксперт пишет 3-4 абзаца: оценка обоих вариантов +
главные риски + рекомендация.
Получишь тройную перспективу: жёсткая правда + вдохновляющее видение + страховка от косяков. Помогает не застрять в одной оптике.
🔧 Техника: полярные роли → острее контраст
Исследование показало, что детальность персон важнее количества. Усиль эффект через антагонистические пары — персоны с противоположными ценностями.
Примеры пар:
- Традиционалист vs Радикал
- Оптимист vs Пессимист
- Локалист vs Глобалист
- Эмпат vs Прагматик
- Этик vs Утилитарист
Вместо "дай мне 5 мнений" проси "дай мне 2 полярных взгляда":
{Опиши задачу}
Дай два радикально противоположных подхода:
1. **[Персона A]** — [крайняя позиция в одну сторону].
Защищает свою точку зрения максимально убедительно.
2. **[Персона B]** — [крайняя позиция в другую сторону].
Защищает свою точку зрения максимально убедительно.
Не пытайся найти золотую середину. Каждая персона искренне
верит в свой подход и критикует противоположный.
Это обостряет дилеммы и показывает крайние точки спектра решений. Полезно когда нужно понять trade-offs.
💡 Экстраполяция: Spark + глубина (комбинация с CoT)
Комбинируй Spark agents с Chain-of-Thought для получения не только разных идей, но и глубокой проработки каждой.
{Опиши задачу}
**Шаг 1:** Дай 5 подходов от разных экспертов (используй
формат Spark agents с детальными персонами).
**Шаг 2:** Выбери 2 самых интересных и непохожих подхода.
**Шаг 3:** Для каждого выбранного подхода распиши пошагово:
- Логику реализации (что делать сначала, что потом)
- Потенциальные препятствия (что может сломаться)
- План преодоления препятствий (как обойти проблемы)
Формат для Шага 3:
---
[Имя эксперта]: [Краткая суть подхода]
**Логика реализации:**
1. ...
2. ...
**Потенциальные препятствия:**
- ...
- ...
**План преодоления:**
- ...
- ...
---
Это даёт и ширину (разные подходы от разных персон), и глубину (детальная проработка лучших вариантов с учётом рисков). Два прохода: сначала дивергентное мышление (разные идеи), потом конвергентное (углубление в лучшие).
Ресурсы
The Spark Effect: On Engineering Creative Diversity in Multi-Agent AI Systems
Авторы: Alexander Doudkin, Anton Voelker, Friedrich von Borries
Организации: Art of X UG, HFBK Hamburg
Дата: Октябрь 2025
Исследование ссылается на:
- AutoGen framework — система для оркестрации мульти-агентных LLM-систем
- MT-Bench и Chatbot Arena — инструменты для калибровки LLM-as-a-judge
- Live Idea Bench — собственный бенчмарк Art of X для оценки креативности моделей (huggingface.co/datasets/6cf/liveideabench-v2)
