TL;DR
Когда просишь LLM генерировать идеи на основе каких-то материалов — она остаётся очень близко к тому, что ей дали. Не потому что нет инструкций "придумай что-то принципиально новое" — они есть во всех протестированных фреймворках, вплоть до "very innovative and unlike anything seen before". Это не работает. Природа LLM — тяготеть к смысловому центру поданных материалов, а не уходить от него.
Главная боль при AI-брейнсторминге — получить 10 идей, которые выглядят разными, но по сути об одном и том же. Это не глюк конкретного промпта. Это системный паттерн: AI-идеи концентрируются теснее, чем то, что придумывают люди в той же области. Когда исследователи замерили смысловую близость идей внутри одной темы — у AI-идей показатель 0.82–0.84, у человеческих работ из той же области — 0.77. Разница небольшая, но она стабильна абсолютно везде: любая модель, любой агентный фреймворк.
Знание этого ограничения меняет стратегию использования AI для генерации идей: не гнаться за "прорывными" идеями от LLM, а сознательно использовать её как машину рекомбинации существующих методов — и отдельно инвестировать в разнообразие входных данных, которые ей даёшь.
Схема паттерна
Что происходит, когда просишь AI генерировать идеи на основе материалов:
ВХОД: материалы (статьи, документы, примеры)
↓
AI-идеи: остаются близко к входу [сходство 0.92]
↓
Разница с исходниками:
→ новые методы решения = берёт и рекомбинирует существующие ✓
→ новые вопросы/проблемы = почти не вводит ✗
Человеческие идеи из тех же материалов: уходят дальше [сходство 0.88]
Что НЕ помогает расширить пространство идей:
❌ Более сложный агентный фреймворк (self-reflection, multi-agent)
❌ Более крупная модель (0.8B → 35B — разница минимальна)
❌ Инструкции "будь максимально оригинальным"
Что помогает:
✅ Разнообразие входных материалов (divergent seed inputs)
✅ Явное использование AI как рекомбинатора, а не инноватора
✅ Картирование "очевидного пространства" → намеренный уход от него
Пример применения
Задача: Ты запускаешь новый Telegram-канал для предпринимателей и просишь ChatGPT придумать форматы контента. Даёшь ей 5 ссылок на похожие каналы — и получаешь 10 идей, которые звучат как вариации одного и того же: "разборы кейсов", "советы по продажам", "истории провалов"... Всё это уже есть везде.
Промпт (двухшаговый):
Шаг 1 — Картируй очевидное:
Вот описания 5 Telegram-каналов для предпринимателей:
[вставь описания или ссылки]
Задача: сгенерируй 10 форматов контента, которые типичны для этой ниши.
Не старайся быть оригинальным — мне нужна карта того, что обычно делают все.
Назови это "Конвенциональное пространство".
Шаг 2 — Уйди от центра:
Вот "Конвенциональное пространство" форматов из предыдущего ответа:
[вставь список]
Теперь задача другая: придумай 5 форматов, которых НЕТ в этом списке.
Принцип: возьми любой формат из смежных областей (подкасты, научпоп, игры, судебные разбирательства, спортивная аналитика),
и адаптируй его механику под предпринимательский контент.
Для каждой идеи: [исходный формат] → [механика] → [как это работает для предпринимателей]
Результат:
Первый шаг выдаст предсказуемый кластер — разборы, советы, истории. Это и есть "смысловой центр" ниши. Второй шаг работает иначе: принудительная рекомбинация механик из чужих областей вытаскивает AI из зоны притяжения. Ты получишь форматы типа "дебаты инвесторов по одному стартапу" (из судебного формата), "MVP-speedrun с таймером" (из игровых стримов), "краш-тест бизнес-плана" (из автомобильной журналистики). Не всё будет рабочим — но пространство явно расширится.
Почему это работает
Слабость LLM — она генерирует текст, предсказывая наиболее вероятное продолжение на основе того, что получила на входе. Когда входные материалы плотно сконцентрированы вокруг одной темы — модель "притягивается" к смысловому центру этого пула. Инструкция "будь оригинальным" — это просто слова в контексте. Они не меняют механику генерации.
Сильная сторона LLM — она отлично рекомбинирует. Если в одном материале есть метод A, в другом — метод B, она легко склеит их в "метод A + B применительно к задаче C". Это и составляет большинство того, чем AI-идеи отличаются от исходников: новые комбинации существующих методов, а не новые вопросы или проблемы.
Как использовать сильную сторону и обойти слабую: Двухшаговая стратегия работает именно так. Сначала разрешаем AI делать то, что она и так сделает — картируем очевидное. Потом принудительно вводим разнообразие через механику из чужих областей. Разнообразие нужно внести в входные данные — его нельзя получить через инструкцию.
Рычаги управления: - 🔧 Разные области как источник механик → чем дальше от целевой темы взят исходный формат, тем сильнее AI уйдёт от центра - 🔧 Явный запрет на конвенциональное (покажи список "запрещённых" идей) → модель активнее ищет в стороне - 🔧 Требование назвать источник рекомбинации ("из какой области взята эта механика") → фильтрует псевдооригинальные идеи, которые на деле — вариации исходного
Шаблон промпта
ШАГ 1 — Карта конвенционального пространства:
Вот {N} примеров/материалов в области {тема}:
[вставь материалы]
Сгенерируй {число} идей, которые ТИПИЧНЫ для этой области.
Не старайся быть оригинальным. Мне нужна карта стандартных решений.
Назови результат "Конвенциональное пространство {темы}".
---
ШАГ 2 — Выход за периметр:
Вот "Конвенциональное пространство {темы}":
[вставь результат шага 1]
Задача: придумай {число} идей, которых НЕТ в этом списке.
Правило: для каждой идеи возьми механику из области {смежная область},
адаптируй её под {тема}.
Формат ответа:
Идея [N]:
- Исходная механика: [из чего взято]
- Как работает: [принцип]
- Применение к {тема}: [конкретно]
Что подставлять:
- {тема} — ваша предметная область (маркетинг, HR, продукт, контент)
- {N} — количество входных материалов (5–10 оптимально)
- {число} — сколько идей на выходе
- {смежная область} — чем дальше от вашей темы, тем лучше (кинопроизводство, военная стратегия, спортивная аналитика, судебная система, видеоигры)
🚀 Быстрый старт — вставь в чат:
Вот шаблон двухшагового брейнсторминга, который обходит типичный кластеринг AI-идей.
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.
[вставить шаблон выше]
LLM спросит про тему, количество идей и смежные области — потому что для шага 2 ей нужен источник механик, от которого зависит качество "выхода за периметр".
Ограничения
⚠️ Частичное исключение — AIScientist: Единственный фреймворк, показавший статистически незначимую разницу в цитировании похожих работ (p=0.275). Итерационная самопроверка чуть лучше других. Но на концентрацию идей это тоже почти не влияет.
⚠️ Метод работает хуже для узких, плотных тем: Если ваша область сама по себе узкая (например, конкретная техническая ниша), "смежные области" могут не дать значимой диверсификации — просто слишком мало семантического расстояния.
⚠️ Больший контекст ≠ больше разнообразия: Давать AI больше материалов не расширяет пространство идей, если материалы из одного кластера. Важно разнообразие источников, а не их количество.
⚠️ AI плохо генерирует новые вопросы: Метод помогает с рекомбинацией методов — это сильная зона LLM. Если вам нужны принципиально новые исследовательские вопросы или проблемные формулировки — AI здесь системно слабее.
Как исследовали
Исследователи из Гонконгского университета поставили вопрос просто: если запустить AI-агентов генерировать научные идеи в масштабе — насколько разнообразным будет результат? Они взяли 19 активных исследовательских областей в AI/ML (от обучения с подкреплением до задач справедливости алгоритмов), подобрали статьи из трёх главных конференций — ICLR, NeurIPS, ICML — и прогнали четыре разных агентных фреймворка через шесть языковых моделей. Итого: 37 802 сгенерированных идеи. Это не маленькая выборка.
Ключевой ход в дизайне: все четыре фреймворка были явно запрограммированы генерировать новое. Один инструктировал агентов создать идеи "very innovative and unlike anything seen before". Другой использовал несколько агентов в роли PhD-студентов и постдоков, которые критикуют друг друга. Третий — итерационную самопроверку идей на новизну. Исследователи специально не стали брать "тупые" инструменты — они взяли лучшее из доступного.
Дальше сравнивали AI-идеи с тремя группами: человеческими статьями из тех же областей, статьями людей, которые вышли из тех же исходных материалов позже, и самими исходниками. Смысловую близость измеряли через векторные представления текстов (пространство смыслов, где близкие по значению тексты находятся рядом).
Что удивило: ни размер модели (от 0.8B до 35B параметров), ни сложность агентного фреймворка практически не меняли картину. Простой zero-shot промпт и многоагентная система с самопроверкой давали почти одинаково кластеризованные идеи. Это неожиданно — интуитивно кажется, что сложнее = лучше. Здесь это не работает.
Адаптации и экстраполяции
🔧 Использовать AI для картирования "зоны очевидного" как конкурентный анализ
Если AI-идеи тяготеют к центру — это можно использовать как разведку: что будут делать конкуренты, которые тоже используют AI? Если у всех одинаковые входные данные (рынок, конкуренты, тренды) — их AI-идеи сойдутся в одну точку.
Вот информация о рынке {ниша}: [данные]
Предположи: какие идеи/решения сгенерирует AI-ассистент типичного игрока рынка
на основе этих данных? Дай список из 7–10 "конвенциональных" решений.
Это — прогноз того, что конкуренты, скорее всего, уже делают или сделают.
Теперь: что из этого списка НЕ стоит делать, чтобы не потеряться среди похожих?
🔧 Принудительная инъекция дивергентности через "запрещённый список"
Дополнение к основному шаблону: перед шагом 2 явно запретить возвращаться к конвенциональному пространству.
Правило: ни одна из твоих идей НЕ должна принадлежать этому списку или быть его вариацией:
[вставь конвенциональное пространство из шага 1]
Если идея похожа на что-то из списка — замени её.
Ресурсы
AI Research Agents Narrow Scientific Exploration — Yixuan Tang, Yi Yang, The Hong Kong University of Science and Technology (ytangch@connect.ust.hk, imyiyang@ust.hk). Препринт 2025.
Связанные фреймворки, упомянутые в исследовании: AIScientist (Lu et al., 2026), ResearchAgent (Baek et al., 2025), AgentLaboratory (Schmidgall et al., 2025).
