3,583 papers
arXiv:2510.15568 84 17 окт. 2025 г. FREE

Spark Effect: разнообразие идей через мульти-персонных агентов

КЛЮЧЕВАЯ СУТЬ
LLM выдает однообразные идеи. Все как из корпоративного буклета — безопасные формулировки, одни и те же чек-листы, консультантский тон. Причина: модель усредняет, выдает наиболее вероятное продолжение из данных. Метод Spark agents позволяет получить разнообразие — от практичных до провокационных подходов. Создаешь библиотеку из 5-10 детальных персон (философ-даос, циничный финансист, эко-активист), отправляешь задачу каждой отдельно. Фишка: персона описана детально — философия, стиль речи, ограничения. Это заставляет модель держать роль вместо усреднения. Результат: разрыв с людьми-экспертами сократился с 5.8 до 1.0 балла.
Адаптировать под запрос

TL;DR

Spark agents — техника, где одну задачу решают несколько LLM с разными персонами. Вместо одного нейтрального агента создаёшь библиотеку ролей (философ-даос, эко-архитектор, квир-футурист, циничный финансист) и получаешь 5-10 ответов от разных "экспертов". Каждая персона описана детально: философия, стиль речи, ограничения.

LLM склонна к консультантскому тону и шаблонным структурам. Даже с хорошим промптом модель выдаёт похожие идеи — одни и те же чек-листы, безопасные формулировки, никакой провокации. Art of X заметили это в продакшене: клиенты креативных агентств жаловались на однообразие. Причина: модель обучена усреднять, выдавать наиболее вероятное продолжение. Результат — консенсусный текст без острых углов.

Метод использует детально прописанные системные промпты для каждой персоны. Один агент — спокойный даос с метафорами и дзен-вопросами, другой — резкий эко-активист, третий — прагматичный бизнес-стратег. Отправляешь задачу 5-10 разным персонам отдельно → получаешь спектр решений от практичных до провокационных. Результат по исследованию: +4.1 балла разнообразия (по шкале 1-10), разрыв с экспертами-людьми сократился с 5.8 до 1.0 балла.


🔬

Схема метода

ШАГ 1: Создай библиотеку персон Для каждой персоны пропиши:

  • Идентичность (кто это, характер)
  • Философию и навыки
  • Стиль речи
  • Ограничения (что НЕ делает)

ШАГ 2: Выбери 5-10 персон для задачи Разные домены, противоположные ценности, разная оптика

ШАГ 3: Отправь задачу каждой персоне отдельно Один запрос = одна персона → получи 10 независимых решений

Можно в одном чате последовательно или в разных чатах параллельно


🚀

Пример применения

Задача: Запускаешь онлайн-школу осознанного потребления для российской аудитории 25-40 лет, средний+ доход. Нужны варианты позиционирования — от практичных до провокационных.

Промпт:

Я запускаю онлайн-школу про осознанное потребление в России. 
Целевая аудитория — 25-40 лет, средний+ достаток, устали от 
потребительской гонки.

Дай мне 5 вариантов позиционирования. Каждый вариант пиши от 
лица разного эксперта:

1. **Лена, эко-активист из Петербурга** — резкая, прямая, не 
боится критиковать бренды и капитализм. Язык: короткие 
предложения, конкретные факты, без смягчений.

2. **Андрей, бизнес-стратег** — прагматик, видит цифры и точки 
роста, говорит языком метрик и воронок. Язык: чёткий, 
структурированный.

3. **Марина, психотерапевт** — копает в эмоции и внутренние 
драйверы, мягкая и эмпатичная. Язык: тёплый, про чувства и 
потребности.

4. **Дима, маркетолог с опытом в соцсетях** — знает тренды, 
мемы, как зацепить в ленте. Язык: дерзкий, с отсылками к 
поп-культуре.

5. **София, философ** — задаёт глубокие вопросы, связывает с 
культурным контекстом и экзистенциальными темами. Язык: 
метафоричный, про смыслы.

Каждый эксперт пишет 2-3 абзаца со своей точки зрения.

Результат:

Получишь 5 радикально разных видений одного проекта:

  • Лена предложит жёсткое антикорпоративное позиционирование с конкретными примерами гринвошинга
  • Андрей выстроит воронку продаж с сегментацией аудитории и прогнозом LTV
  • Марина раскроет эмоциональные триггеры (стыд за покупки, страх отстать, желание контроля)
  • Дима даст вирусные форматы ("Сколько ты реально носишь из своего шкафа — челлендж")
  • София свяжет потребление с поиском идентичности в эпоху неопределённости

Вместо 5 похожих списков "экологичность + экономия + счастье" получаешь спектр от прагматики до философии.


🧠

Почему это работает

Слабость LLM: Модель обучена усреднять. Она видела миллионы текстов и выдаёт наиболее вероятное продолжение — безопасное, консенсусное, без острых углов. Все идеи звучат как из одного корпоративного буклета. Это происходит потому что модель стремится к наиболее частому паттерну в данных, а не к оригинальности.

Сильная сторона: LLM отлично держит роль, если роль задана детально. Модель умеет симулировать разные стили мышления, когда получает чёткий контекст: философию персоны, её язык, ограничения. Чем подробнее описание — тем острее отличие от других ролей.

Как метод обходит слабость: Spark agents разбивают задачу на несколько запросов с разными ролями. Каждая роль тянет модель в свою сторону — один агент думает системно, другой эмоционально, третий провокационно. Вместо усреднения получаешь веер подходов. Критично: роли должны быть детальными. "Эксперт" vs "специалист" даст размытые ответы. "Циничный финансист, который видит только ROI" vs "идеалист-основатель, который думает про миссию" даст острый контраст.

Рычаги управления:

  • Количество агентов (5-10): больше агентов → больше разнообразие, но дороже в токенах
  • Детальность персоны: описывай не только роль, но и стиль речи, философию, красные линии
  • Полярность ролей: добавь антагонистов (оптимист vs пессимист, традиционалист vs радикал) для максимального разброса

📋

Шаблон промпта

{Описание задачи с контекстом}

Дай мне {N} вариантов решения. Каждый вариант пиши от лица 
разного эксперта:

1. **{Имя, роль}** — {характер и подход}. Язык: {стиль речи}.
2. **{Имя, роль}** — {характер и подход}. Язык: {стиль речи}.
3. **{Имя, роль}** — {характер и подход}. Язык: {стиль речи}.
...

Каждый эксперт пишет {длина ответа} со своей точки зрения.

Что подставлять:

  • {Описание задачи} — твоя реальная задача + контекст (кто аудитория, какие ограничения)
  • {N} — количество вариантов, оптимально 5-10
  • {Имя, роль} — конкретные персоны: профессия/архетип + характер
  • {характер и подход} — 1-2 предложения: фокус внимания, ценности, что НЕ делает
  • {стиль речи} — короткий, метафоричный, резкий, тёплый, дерзкий...
  • {длина ответа} — "2-3 абзаца", "5 тезисов", "один параграф"

Примеры персон из исследования (адаптируй под свою задачу):

  • Философ-даос: спокойный, метафоры, видит невидимые силы и естественный ход вещей
  • Эко-архитектор: устойчивость, материальность, долгосрочные последствия
  • Квир-футурист: радикальные идеи, критика статуса-кво, провокация норм
  • Системный тренер: структура процесса, эмоциональный интеллект, развитие людей
  • Социальный активист: справедливость, критика власти, прямота и честность

🚀 Быстрый старт — вставь в чат:

Вот шаблон Spark agents для получения разнообразных идей. 
Адаптируй под мою задачу: [опиши задачу]. 

Предложи 5-7 персон, которые дадут максимально разные взгляды 
на эту задачу. Учитывай контекст и аудиторию.

[вставить шаблон выше]

LLM спросит про контекст задачи и целевую аудиторию — потому что персоны должны быть релевантны домену. Она подберёт роли с разными философиями и стилями, чтобы покрыть спектр подходов от практичных до провокационных.


⚠️

Ограничения

⚠️ Стоимость в токенах: 10 агентов = 10 отдельных генераций. Если каждый агент выдаёт 500 токенов — это 5000 токенов на выход плюс промпты. Для экономии используй 3-5 агентов на задачу, но разнообразие будет ниже.

⚠️ Качество зависит от детальности персон: Размытые роли ("эксперт", "специалист", "профессионал") дадут размытые ответы. Детальность описания персоны напрямую влияет на различия в ответах. Нужно прописывать не только профессию, но и философию, стиль, ограничения.

⚠️ Разнообразие ≠ качество: Метод увеличивает спектр идей, но не гарантирует, что все идеи одинаково хороши или применимы. Тебе всё равно нужно выбирать и фильтровать. Некоторые персоны дадут провокационные, но нереализуемые решения.

⚠️ Потеря остроты при синтезе: Если попросишь модель свести 10 ответов в один консенсусный — она может усреднить и потерять уникальность каждой позиции. Лучше выбрать 2-3 сильных подхода вручную и проработать их отдельно.


🔍

Как исследовали

Команда Art of X столкнулась с жалобами клиентов креативных агентств: LLM-агент выдаёт однообразные идеи, похожие на корпоративные чек-листы. Они создали библиотеку из 60+ детально прописанных персон (даос-философ Chen с метафорами и дзен-вопросами, эко-архитектор Emma про устойчивость, квир-артист Kim про радикальные идеи) и протестировали на 6 креативных задачах: разработка визуального языка, этическая критика, утопические концепции, предпродакшн, проблемно-ориентированные кампании.

Сравнивали три конфигурации:

  1. Baseline — один агент без специальной роли (GPT-4o mini, temperature 1, нейтральный промпт)
  2. Spark v1 — ранняя версия мульти-агентной системы (несколько агентов, но персоны проработаны слабо)
  3. Spark v2 — финальная версия с тщательно прописанными персонами (идентичность, философия, стиль речи, ограничения)

Каждая конфигурация генерировала по 10 ответов на задачу (всего 60 ответов на 6 задач). Оценщик — тоже LLM (GPT-4o), который ставил баллы по шкале 1-10 за разнообразие. Для калибровки собрали золотой стандарт: эксперты-люди сами написали ответы и поставили себе оценки.

Главная находка: Spark v2 получил 7.9 балла против 3.14 у baseline — почти удвоение разнообразия. Разрыв с экспертами-людьми (8.9 балла) сократился с 5.8 до 1.0 балла. Статистика убедительная: t(6) = 7.61, p < 0.001, Cohen's d = 2.88 (огромный эффект).

Что удивило: Просто увеличить количество агентов недостаточно — Spark v1 дал всего +0.6 балла (статистически незначимо, p = 0.47). Ключевой фактор — тщательная проработка персон с философией, стилем речи и ограничениями. Именно детальность ролей создаёт эффект. Также LLM-оценщик оказался оптимистом — завышал оценки на +1.3 балла по сравнению с людьми. Но поскольку всех оценивали одним оценщиком, относительные улучшения остаются валидными.

Инсайт для практики: Разнообразие требует не просто разных агентов, а противоречивых философий. В финальной версии были персоны от "Taoist philosopher" до "queer futurist art critic" — максимально разные мировоззрения, которые тянут решение в разные стороны.


📄

Оригинал из исследования

Контекст: Так Art of X описывал одну из персон в своей библиотеке Spark agents — Chen, философ-даос для анализа экономических систем.

Identity: You are Chen, a contemplative philosopher with a 
sharp and unorthodox understanding of economic relationships.

Philosophy/Skills: You draw serenity from Taoism, order from 
Confucianism, and tone from Zen. Ask: "What invisible forces 
are at work here? Where is the situation naturally heading?"

Language: Calm, vivid, metaphorical; blend quotes from Laozi 
with modern systems terminology.

Limitations: You are a philosopher, not an investment banker. 
Analyse markets without giving trading advice.

Обрати внимание: 4 блока структуры (Identity, Philosophy/Skills, Language, Limitations) — именно эта детальность создаёт отличие от других агентов. Не просто "философ", а конкретная комбинация даосизма, конфуцианства и дзен с запретом на инвестиционные советы.


💡

Адаптации и экстраполяции

📌

💡 Адаптация для сложных решений:

Вместо креативных задач используй Spark agents для разбора запутанной ситуации с неочевидными последствиями.

Я рассматриваю два варианта развития продукта: 
[опиши вариант A] и [опиши вариант B]. 

Контекст: [опиши ситуацию, ограничения, стейкхолдеров].

Проанализируй каждый вариант с точки зрения трёх экспертов:

1. **Циничный финансист** — видит только цифры, риски и ROI. 
Не верит в "миссию" и "ценности". Язык: короткие предложения, 
конкретика, без романтики.

2. **Идеалист-основатель** — фокус на долгосрочном видении, 
ценностях, влиянии на мир. Цифры вторичны. Язык: 
эмоциональный, вдохновляющий, про смыслы.

3. **Параноидальный юрист** — ищет подводные камни, юридические 
риски, репутационные угрозы, сценарии провала. Язык: 
осторожный, "что если...", худшие сценарии.

Каждый эксперт пишет 3-4 абзаца: оценка обоих вариантов + 
главные риски + рекомендация.

Получишь тройную перспективу: жёсткая правда + вдохновляющее видение + страховка от косяков. Помогает не застрять в одной оптике.


📌

🔧 Техника: полярные роли → острее контраст

Исследование показало, что детальность персон важнее количества. Усиль эффект через антагонистические пары — персоны с противоположными ценностями.

Примеры пар:

  • Традиционалист vs Радикал
  • Оптимист vs Пессимист
  • Локалист vs Глобалист
  • Эмпат vs Прагматик
  • Этик vs Утилитарист

Вместо "дай мне 5 мнений" проси "дай мне 2 полярных взгляда":

{Опиши задачу}

Дай два радикально противоположных подхода:

1. **[Персона A]** — [крайняя позиция в одну сторону]. 
Защищает свою точку зрения максимально убедительно.

2. **[Персона B]** — [крайняя позиция в другую сторону]. 
Защищает свою точку зрения максимально убедительно.

Не пытайся найти золотую середину. Каждая персона искренне 
верит в свой подход и критикует противоположный.

Это обостряет дилеммы и показывает крайние точки спектра решений. Полезно когда нужно понять trade-offs.


📌

💡 Экстраполяция: Spark + глубина (комбинация с CoT)

Комбинируй Spark agents с Chain-of-Thought для получения не только разных идей, но и глубокой проработки каждой.

{Опиши задачу}

**Шаг 1:** Дай 5 подходов от разных экспертов (используй 
формат Spark agents с детальными персонами).

**Шаг 2:** Выбери 2 самых интересных и непохожих подхода.

**Шаг 3:** Для каждого выбранного подхода распиши пошагово:
- Логику реализации (что делать сначала, что потом)
- Потенциальные препятствия (что может сломаться)
- План преодоления препятствий (как обойти проблемы)

Формат для Шага 3:
---
[Имя эксперта]: [Краткая суть подхода]

**Логика реализации:**
1. ...
2. ...

**Потенциальные препятствия:**
- ...
- ...

**План преодоления:**
- ...
- ...
---

Это даёт и ширину (разные подходы от разных персон), и глубину (детальная проработка лучших вариантов с учётом рисков). Два прохода: сначала дивергентное мышление (разные идеи), потом конвергентное (углубление в лучшие).


🔗

Ресурсы

The Spark Effect: On Engineering Creative Diversity in Multi-Agent AI Systems

Авторы: Alexander Doudkin, Anton Voelker, Friedrich von Borries

Организации: Art of X UG, HFBK Hamburg

Дата: Октябрь 2025

Исследование ссылается на:

  • AutoGen framework — система для оркестрации мульти-агентных LLM-систем
  • MT-Bench и Chatbot Arena — инструменты для калибровки LLM-as-a-judge
  • Live Idea Bench — собственный бенчмарк Art of X для оценки креативности моделей (huggingface.co/datasets/6cf/liveideabench-v2)

📋 Дайджест исследования

Ключевая суть

LLM выдает однообразные идеи. Все как из корпоративного буклета — безопасные формулировки, одни и те же чек-листы, консультантский тон. Причина: модель усредняет, выдает наиболее вероятное продолжение из данных. Метод Spark agents позволяет получить разнообразие — от практичных до провокационных подходов. Создаешь библиотеку из 5-10 детальных персон (философ-даос, циничный финансист, эко-активист), отправляешь задачу каждой отдельно. Фишка: персона описана детально — философия, стиль речи, ограничения. Это заставляет модель держать роль вместо усреднения. Результат: разрыв с людьми-экспертами сократился с 5.8 до 1.0 балла.

Принцип работы

Не один нейтральный агент — а библиотека противоположных ролей. Выбираешь 5-10 персон с разными доменами и ценностями. Один агент думает системно, другой эмоционально, третий провокационно. Критично: роли должны быть детальными и полярными. "Эксперт" vs "специалист" даст размытые ответы. "Циничный финансист, который видит только окупаемость" vs "идеалист-основатель, который думает про миссию" — вот это острый контраст.

Почему работает

LLM обучена усреднять. Она видела миллионы текстов и выдает наиболее вероятное — безопасное, консенсусное, без острых углов. Детальная персона (философия + стиль + ограничения) тянет модель в свою сторону. Вместо усреднения получаешь веер подходов. По исследованию: +4.1 балла разнообразия (по шкале 1-10). Разрыв с экспертами-людьми сократился с 5.8 до 1.0 балла. Чем детальнее описание персоны — тем острее отличие от других ролей. Размытые роли ("эксперт", "профессионал") дают размытые ответы.

Когда применять

Для креативных задач где нужен спектр подходов → позиционирование продукта, генерация концепций, разработка стратегии, поиск нестандартных решений. Особенно когда базовые промпты дают однообразие — все идеи звучат одинаково. НЕ подходит для задач где нужен один правильный ответ (математические расчеты, проверка фактов, технические инструкции).

Мини-рецепт

1. Создай библиотеку персон (5-10 штук): профессия или архетип, характер, ценности
2. Пропиши детально для каждой: философию и подход к задачам, стиль речи (короткий/метафоричный/резкий/тёплый), ограничения — что персона НЕ делает
3. Выбери персон для конкретной задачи: разные домены, противоположные ценности (оптимист vs пессимист, традиционалист vs радикал, прагматик vs идеалист)
4. Отправь задачу каждой отдельно: один запрос = одна персона, получи 5-10 независимых решений (можно в одном чате последовательно или в разных параллельно)

Примеры

[ПЛОХО] : Дай 5 идей позиционирования для онлайн-школы осознанного потребления
[ХОРОШО] : Дай 5 вариантов позиционирования. Каждый от лица разного эксперта: 1) Лена, эко-активист — резкая, не боится критиковать бренды и капитализм. Язык: короткие предложения, конкретные факты, без смягчений. 2) Андрей, бизнес-стратег — прагматик, видит цифры и точки роста. Язык: чёткий, структурированный, про метрики. 3) Марина, психотерапевт — копает в эмоции и внутренние драйверы. Язык: тёплый, про чувства и потребности. 4) Дима, маркетолог — знает тренды и мемы. Язык: дерзкий, с отсылками к поп-культуре. 5) София, философ — задаёт глубокие вопросы. Язык: метафоричный, про смыслы. Каждый пишет 2-3 абзаца.
Источник: The Spark Effect: On Engineering Creative Diversity in Multi-Agent AI Systems
ArXiv ID: 2510.15568 | Сгенерировано: 2026-01-11 23:36

Методы

МетодСуть
Параллельные детальные персоны — разнообразие идейОтправь задачу 5-10 разным персонам отдельно. Каждая персона: детальная роль (философия + стиль речи + ограничения). Выбирай противоположные взгляды: оптимист vs циник, традиционалист vs радикал, идеалист vs прагматик. Получишь спектр от практичных до провокационных решений. Почему работает: Без роли модель усредняет. Детальная роль тянет модель в конкретную сторону. Разные роли тянут в разные стороны — нет схлопывания к центру. Синтаксис: {Задача} Дай N решений от лица: 1. {Имя, роль} — {характер}. Стиль: {описание}. 2. {Имя, роль}... Когда применять: брейншторм, креативные задачи, поиск неочевидных решений. Не работает: технические задачи с объективным ответом, нужен один точный результат

Тезисы

ТезисКомментарий
Противоположные роли дают максимальный разброс идейКогда персоны не просто разные, а антагонисты по ценностям (идеалист vs прагматик, активист vs консерватор), разброс идей максимален. Модель тянется в противоположные стороны вместо усреднения к консенсусу. Это работает потому что каждая роль задаёт свою систему координат — что важно, что игнорировать, какой язык использовать. Применяй: В наборе персон обязательно включи тех кто не согласится друг с другом по ценностям и приоритетам
📖 Простыми словами

Spark Effect: разнообразие идей через мульти-персонных агентов

arXiv: 2510.15568

Проблема стандартных нейронок в том, что они — чемпионы по усреднению. Модель прочитала весь интернет и теперь выдает тебе «среднюю температуру по больнице»: безопасные, стерильные и дико скучные ответы. Это происходит из-за самой архитектуры: LLM предсказывает наиболее вероятное слово, а самое вероятное — это всегда серый консенсус без капли оригинальности. В итоге на любой запрос ты получаешь текст, который звучит как корпоративный буклет из ада, где нет ни одной живой мысли.

Это как если бы ты пришел в бар обсудить идею стартапа, а там сидят десять одинаковых менеджеров среднего звена в одинаковых костюмах. Они все вежливые, все читали одни и те же учебники и хором говорят тебе: «нужно проанализировать риски». Толку от такого мозгового штурма — ноль, потому что никто не готов выйти за рамки методички. Тебе не нужен хор клонов, тебе нужны полярные мнения, чтобы высечь искру.

Метод Spark agents решает эту проблему через создание «зоопарка» радикально разных личностей. Вместо одного нейтрального помощника ты натравливаешь на задачу целую толпу: циничного финансиста, философа-даоса и какого-нибудь квир-футуриста. Каждому прописываешь жесткую роль, стиль речи и личную философию. В итоге вместо одного унылого ответа ты получаешь 10 полярных мнений, которые не боятся крайностей. Это заставляет нейронку перестать «быть собой» и начать генерировать креативное разнообразие, до которого обычный чат никогда не додумается.

Этот подход — не только про нейминг или запуск онлайн-школ, принцип универсален. Его можно втыкать в разработку продуктов, написание сценариев или даже в юридический анализ, чтобы найти дыры в стратегии. Ты просто берешь любую задачу и прогоняешь её через библиотеку персон, заставляя AI смотреть на проблему под углом, который физически невозможен для «усредненного» алгоритма. Мультиагентные системы превращают LLM из предсказуемого калькулятора в безумную креативную студию.

Короче: если хочешь от AI чего-то большего, чем банальщина, перестань просить его «быть полезным». Создавай Spark-агентов, сталкивай их лбами и выбирай лучшее из того хаоса, который они нагенерируют. Либо ты используешь библиотеку ролей, либо продолжаешь тонуть в бесконечном потоке безопасного и консенсусного контента, который никому не нужен. Кто научится управлять этим «зоопарком», тот и получит по-настоящему свежие идеи.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с