3,583 papers
arXiv:2605.27905 74 27 мая 2026 г. FREE

AI-идеация тяготеет к центру: почему LLM сжимает пространство идей и как с этим работать

КЛЮЧЕВАЯ СУТЬ
Парадокс: написать «придумай что-то принципиально новое» — бесполезно. Исследователи протестировали все популярные агентные системы, включая те, где инструкция звучала как «unlike anything seen before». Не сработало ни разу. LLM структурно притягивается к смысловому центру того, что ей дали — это не баг промпта, это механика генерации. Метод позволяет реально расширить пространство идей — получать форматы и решения, которые не являются вариациями одного кластера. Фишка: разнообразие нельзя вытащить через инструкцию — его нужно внести в входные данные. Двухшаговый подход сначала картирует «запрещённое пространство», потом принудительно тащит модель из него через механики чужих областей.
Адаптировать под запрос

TL;DR

Когда просишь LLM генерировать идеи на основе каких-то материалов — она остаётся очень близко к тому, что ей дали. Не потому что нет инструкций "придумай что-то принципиально новое" — они есть во всех протестированных фреймворках, вплоть до "very innovative and unlike anything seen before". Это не работает. Природа LLM — тяготеть к смысловому центру поданных материалов, а не уходить от него.

Главная боль при AI-брейнсторминге — получить 10 идей, которые выглядят разными, но по сути об одном и том же. Это не глюк конкретного промпта. Это системный паттерн: AI-идеи концентрируются теснее, чем то, что придумывают люди в той же области. Когда исследователи замерили смысловую близость идей внутри одной темы — у AI-идей показатель 0.82–0.84, у человеческих работ из той же области — 0.77. Разница небольшая, но она стабильна абсолютно везде: любая модель, любой агентный фреймворк.

Знание этого ограничения меняет стратегию использования AI для генерации идей: не гнаться за "прорывными" идеями от LLM, а сознательно использовать её как машину рекомбинации существующих методов — и отдельно инвестировать в разнообразие входных данных, которые ей даёшь.


📌

Схема паттерна

Что происходит, когда просишь AI генерировать идеи на основе материалов:

ВХОД: материалы (статьи, документы, примеры) 
  ↓
AI-идеи: остаются близко к входу [сходство 0.92]
  ↓
Разница с исходниками: 
  → новые методы решения = берёт и рекомбинирует существующие ✓
  → новые вопросы/проблемы = почти не вводит ✗

Человеческие идеи из тех же материалов: уходят дальше [сходство 0.88]
Что НЕ помогает расширить пространство идей:
  ❌ Более сложный агентный фреймворк (self-reflection, multi-agent)
  ❌ Более крупная модель (0.8B → 35B — разница минимальна)
  ❌ Инструкции "будь максимально оригинальным"

Что помогает:
  ✅ Разнообразие входных материалов (divergent seed inputs)
  ✅ Явное использование AI как рекомбинатора, а не инноватора
  ✅ Картирование "очевидного пространства" → намеренный уход от него

🚀

Пример применения

Задача: Ты запускаешь новый Telegram-канал для предпринимателей и просишь ChatGPT придумать форматы контента. Даёшь ей 5 ссылок на похожие каналы — и получаешь 10 идей, которые звучат как вариации одного и того же: "разборы кейсов", "советы по продажам", "истории провалов"... Всё это уже есть везде.

Промпт (двухшаговый):

Шаг 1 — Картируй очевидное:

Вот описания 5 Telegram-каналов для предпринимателей:
[вставь описания или ссылки]

Задача: сгенерируй 10 форматов контента, которые типичны для этой ниши.
Не старайся быть оригинальным — мне нужна карта того, что обычно делают все.
Назови это "Конвенциональное пространство".

Шаг 2 — Уйди от центра:

Вот "Конвенциональное пространство" форматов из предыдущего ответа:
[вставь список]

Теперь задача другая: придумай 5 форматов, которых НЕТ в этом списке.
Принцип: возьми любой формат из смежных областей (подкасты, научпоп, игры, судебные разбирательства, спортивная аналитика), 
и адаптируй его механику под предпринимательский контент.

Для каждой идеи: [исходный формат] → [механика] → [как это работает для предпринимателей]

Результат:

Первый шаг выдаст предсказуемый кластер — разборы, советы, истории. Это и есть "смысловой центр" ниши. Второй шаг работает иначе: принудительная рекомбинация механик из чужих областей вытаскивает AI из зоны притяжения. Ты получишь форматы типа "дебаты инвесторов по одному стартапу" (из судебного формата), "MVP-speedrun с таймером" (из игровых стримов), "краш-тест бизнес-плана" (из автомобильной журналистики). Не всё будет рабочим — но пространство явно расширится.


🧠

Почему это работает

Слабость LLM — она генерирует текст, предсказывая наиболее вероятное продолжение на основе того, что получила на входе. Когда входные материалы плотно сконцентрированы вокруг одной темы — модель "притягивается" к смысловому центру этого пула. Инструкция "будь оригинальным" — это просто слова в контексте. Они не меняют механику генерации.

Сильная сторона LLM — она отлично рекомбинирует. Если в одном материале есть метод A, в другом — метод B, она легко склеит их в "метод A + B применительно к задаче C". Это и составляет большинство того, чем AI-идеи отличаются от исходников: новые комбинации существующих методов, а не новые вопросы или проблемы.

Как использовать сильную сторону и обойти слабую: Двухшаговая стратегия работает именно так. Сначала разрешаем AI делать то, что она и так сделает — картируем очевидное. Потом принудительно вводим разнообразие через механику из чужих областей. Разнообразие нужно внести в входные данные — его нельзя получить через инструкцию.

Рычаги управления: - 🔧 Разные области как источник механик → чем дальше от целевой темы взят исходный формат, тем сильнее AI уйдёт от центра - 🔧 Явный запрет на конвенциональное (покажи список "запрещённых" идей) → модель активнее ищет в стороне - 🔧 Требование назвать источник рекомбинации ("из какой области взята эта механика") → фильтрует псевдооригинальные идеи, которые на деле — вариации исходного


📋

Шаблон промпта

ШАГ 1 — Карта конвенционального пространства:

Вот {N} примеров/материалов в области {тема}:
[вставь материалы]

Сгенерируй {число} идей, которые ТИПИЧНЫ для этой области.
Не старайся быть оригинальным. Мне нужна карта стандартных решений.
Назови результат "Конвенциональное пространство {темы}".

---

ШАГ 2 — Выход за периметр:

Вот "Конвенциональное пространство {темы}":
[вставь результат шага 1]

Задача: придумай {число} идей, которых НЕТ в этом списке.

Правило: для каждой идеи возьми механику из области {смежная область},
адаптируй её под {тема}.

Формат ответа:
Идея [N]:
- Исходная механика: [из чего взято]
- Как работает: [принцип]
- Применение к {тема}: [конкретно]

Что подставлять: - {тема} — ваша предметная область (маркетинг, HR, продукт, контент) - {N} — количество входных материалов (5–10 оптимально) - {число} — сколько идей на выходе - {смежная область} — чем дальше от вашей темы, тем лучше (кинопроизводство, военная стратегия, спортивная аналитика, судебная система, видеоигры)

🚀 Быстрый старт — вставь в чат:

Вот шаблон двухшагового брейнсторминга, который обходит типичный кластеринг AI-идей.
Адаптируй под мою задачу: {твоя задача}.
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит про тему, количество идей и смежные области — потому что для шага 2 ей нужен источник механик, от которого зависит качество "выхода за периметр".


⚠️

Ограничения

⚠️ Частичное исключение — AIScientist: Единственный фреймворк, показавший статистически незначимую разницу в цитировании похожих работ (p=0.275). Итерационная самопроверка чуть лучше других. Но на концентрацию идей это тоже почти не влияет.

⚠️ Метод работает хуже для узких, плотных тем: Если ваша область сама по себе узкая (например, конкретная техническая ниша), "смежные области" могут не дать значимой диверсификации — просто слишком мало семантического расстояния.

⚠️ Больший контекст ≠ больше разнообразия: Давать AI больше материалов не расширяет пространство идей, если материалы из одного кластера. Важно разнообразие источников, а не их количество.

⚠️ AI плохо генерирует новые вопросы: Метод помогает с рекомбинацией методов — это сильная зона LLM. Если вам нужны принципиально новые исследовательские вопросы или проблемные формулировки — AI здесь системно слабее.


🔍

Как исследовали

Исследователи из Гонконгского университета поставили вопрос просто: если запустить AI-агентов генерировать научные идеи в масштабе — насколько разнообразным будет результат? Они взяли 19 активных исследовательских областей в AI/ML (от обучения с подкреплением до задач справедливости алгоритмов), подобрали статьи из трёх главных конференций — ICLR, NeurIPS, ICML — и прогнали четыре разных агентных фреймворка через шесть языковых моделей. Итого: 37 802 сгенерированных идеи. Это не маленькая выборка.

Ключевой ход в дизайне: все четыре фреймворка были явно запрограммированы генерировать новое. Один инструктировал агентов создать идеи "very innovative and unlike anything seen before". Другой использовал несколько агентов в роли PhD-студентов и постдоков, которые критикуют друг друга. Третий — итерационную самопроверку идей на новизну. Исследователи специально не стали брать "тупые" инструменты — они взяли лучшее из доступного.

Дальше сравнивали AI-идеи с тремя группами: человеческими статьями из тех же областей, статьями людей, которые вышли из тех же исходных материалов позже, и самими исходниками. Смысловую близость измеряли через векторные представления текстов (пространство смыслов, где близкие по значению тексты находятся рядом).

Что удивило: ни размер модели (от 0.8B до 35B параметров), ни сложность агентного фреймворка практически не меняли картину. Простой zero-shot промпт и многоагентная система с самопроверкой давали почти одинаково кластеризованные идеи. Это неожиданно — интуитивно кажется, что сложнее = лучше. Здесь это не работает.


💡

Адаптации и экстраполяции

📌

🔧 Использовать AI для картирования "зоны очевидного" как конкурентный анализ

Если AI-идеи тяготеют к центру — это можно использовать как разведку: что будут делать конкуренты, которые тоже используют AI? Если у всех одинаковые входные данные (рынок, конкуренты, тренды) — их AI-идеи сойдутся в одну точку.

Вот информация о рынке {ниша}: [данные]

Предположи: какие идеи/решения сгенерирует AI-ассистент типичного игрока рынка 
на основе этих данных? Дай список из 7–10 "конвенциональных" решений.

Это — прогноз того, что конкуренты, скорее всего, уже делают или сделают.
Теперь: что из этого списка НЕ стоит делать, чтобы не потеряться среди похожих?
📌

🔧 Принудительная инъекция дивергентности через "запрещённый список"

Дополнение к основному шаблону: перед шагом 2 явно запретить возвращаться к конвенциональному пространству.

Правило: ни одна из твоих идей НЕ должна принадлежать этому списку или быть его вариацией:
[вставь конвенциональное пространство из шага 1]

Если идея похожа на что-то из списка — замени её.

🔗

Ресурсы

AI Research Agents Narrow Scientific Exploration — Yixuan Tang, Yi Yang, The Hong Kong University of Science and Technology (ytangch@connect.ust.hk, imyiyang@ust.hk). Препринт 2025.

Связанные фреймворки, упомянутые в исследовании: AIScientist (Lu et al., 2026), ResearchAgent (Baek et al., 2025), AgentLaboratory (Schmidgall et al., 2025).


📋 Дайджест исследования

Ключевая суть

Парадокс: написать «придумай что-то принципиально новое» — бесполезно. Исследователи протестировали все популярные агентные системы, включая те, где инструкция звучала как «unlike anything seen before». Не сработало ни разу. LLM структурно притягивается к смысловому центру того, что ей дали — это не баг промпта, это механика генерации. Метод позволяет реально расширить пространство идей — получать форматы и решения, которые не являются вариациями одного кластера. Фишка: разнообразие нельзя вытащить через инструкцию — его нужно внести в входные данные. Двухшаговый подход сначала картирует «запрещённое пространство», потом принудительно тащит модель из него через механики чужих областей.

Принцип работы

LLM предсказывает следующий токен на основе входного контекста. Если материалы однотемные и плотные — модель тонет в их центре. Это как попросить компас показывать на юг: слова не меняют физику. Но у LLM есть сильная сторона — она отлично рекомбинирует. Дай ей метод A из одного источника и метод B из другого — она легко склеит «A+B для задачи C». Ключ: сначала создай явную карту «занятого пространства» — покажи, что уже есть. Потом модель ищет в стороне, а не в центре. Явный запрет конвенционального работает сильнее, чем инструкция «будь оригинальным».

Почему работает

Числа из исследования: смысловое сходство AI-идей внутри одной темы — 0.82–0.84. У человеческих работ из той же области — 0.77. Разница кажется небольшой, но она стабильна абсолютно везде — любая модель, любой агентный фреймворк. Увеличение модели с 800 миллионов до 35 миллиардов параметров — разница минимальная. Добавление самопроверки и многоагентной архитектуры — тоже не помогает. Суть: это не проблема конкретного промпта — это системный паттерн LLM. Поэтому «улучшить промпт» не спасёт. Нужна другая стратегия входа.

Когда применять

Брейнсторминг идей → конкретно для контента, продуктовых возможностей, форматов, маркетинговых механик, названий — особенно когда уже получил «10 идей, которые про одно и то же». НЕ подходит для: задач где нужны принципиально новые исследовательские вопросы или проблемные формулировки — там LLM системно слабее, и двухшаговый подход не закрывает эту дыру.

Мини-рецепт

1. Картируй очевидное: дай модели материалы и попроси типичное — Вот N примеров в области X. Перечисли идеи, которые ТИПИЧНЫ для этой ниши. Не старайся быть оригинальным — мне нужна карта стандартных решений. Назови это «Конвенциональное пространство».

2. Заяви запрет: вставь результат первого шага и скажи модели — Вот список занятого пространства. Придумай идеи, которых НЕТ в этом списке.

3. Дай источник рекомбинации: добавь конкретную чужую область — Правило: для каждой идеи возьми механику из области [кино / военная стратегия / спортивная аналитика / видеоигры / судебная система] и адаптируй под [твою тему].

4. Потребуй назвать источник: Формат: исходная механика → принцип → применение к [тема]. Это фильтрует псевдооригинальные идеи, которые на деле — вариации исходного.

Примеры

[ПЛОХО] : Предложи 10 оригинальных форматов для предпринимательского Telegram-канала. Будь максимально инновационным, придумай что-то unlike anything seen before.
[ХОРОШО] : Шаг 1: Вот описания 5 Telegram-каналов для предпринимателей: [вставь]. Перечисли форматы, которые типичны для этой ниши — мне нужна карта стандартных решений, не старайся быть оригинальным. Назови это «Конвенциональное пространство». Шаг 2: Вот «Конвенциональное пространство»: [вставь список из шага 1]. Придумай 5 форматов, которых НЕТ в этом списке. Правило: для каждой идеи возьми механику из области судебных разбирательств или спортивной аналитики и адаптируй под предпринимательский контент. Формат: [исходная механика] → [принцип] → [как работает для предпринимателей].
Источник: AI Research Agents Narrow Scientific Exploration
ArXiv ID: 2605.27905 | Сгенерировано: 2026-05-28 07:31

Проблемы LLM

ПроблемаСутьКак обойти
Инструкция "будь оригинальным" не работаетПросишь AI: "придумай 10 необычных идей". Получаешь 10 вариаций одного. Меняешь на "будь максимально оригинальным" — то же самое. Берёшь более крупную модель — то же самое. Это не баг конкретного запроса. Модель тяготеет к смысловому центру входных данных. Слова об оригинальности этот центр не сдвигают. Проблема для любых задач: брейнсторминг, форматы контента, гипотезы, решенияНе требуй оригинальности словами. Вместо этого: сначала картируй "типичное пространство" — разреши модели делать то, что она и так сделает. Потом принудительно разрывай: давай механики из далёких областей как входные данные для второго шага

Методы

МетодСуть
Двухшаговый брейнсторминг — карта центра и выход за периметрШаг 1. Попроси типичные идеи: "Сгенерируй {N} идей, которые типичны для области {тема}. Не старайся быть оригинальным. Мне нужна карта стандартных решений. Назови это: Конвенциональное пространство {темы}." Шаг 1 "сливает" притяжение модели к центру — она делает то, что хочет сделать естественно. Шаг 2. Дай список из шага 1 и скажи: "Придумай {N} идей, которых НЕТ в этом списке. Для каждой: возьми механику из области {далёкая смежная область}, адаптируй под {твою задачу}. Формат: Исходная механика Принцип Применение." Почему работает: разнообразие входит через данные (механики из чужих областей), а не через слова. Чем дальше чужая область от твоей темы — тем сильнее отрыв от центра. Явный список запрещённых идей заставляет модель искать в стороне. Когда не работает: очень узкие технические ниши; генерация принципиально новых вопросов или проблем (а не методов их решения)

Тезисы

ТезисКомментарий
Модель рекомбинирует методы — но не придумывает новые вопросыAI-идеи отличаются от исходников в основном новыми комбинациями: метод A + метод B = метод AB для задачи C. Это работает хорошо. Принципиально новые проблемные вопросы или новые формулировки задач — AI генерирует системно хуже. Применяй: используй AI для "как решить задачу" — давай ей чёткую задачу на входе. Для "что вообще решать" — не полагайся на AI-брейнсторминг как основной источник
📖 Простыми словами

AIResearchAgentsNarrow Scientific Exploration

arXiv: 2605.27905

Суть проблемы в том, что нейронки по своей природе — жуткие консерваторы. Когда ты скармливаешь LLM пачку материалов и просишь выдать на их основе что-то свежее, она не летит в космос за новыми идеями, а вцепляется мертвой хваткой в то, что уже видела. Это фундаментальная механика: модель предсказывает наиболее вероятное продолжение текста, а значит, она всегда будет тяготеть к смысловому центру того, что ей дали. Для нее «новое» — это просто перетасованная колода старых карт, и никакие инструкции тут не помогут.

Это как если бы ты пришел к дизайнеру, показал ему пять фотографий серых бетонных коробок и приказал: «сделай что-то невероятно авангардное и ни на что не похожее». Дизайнер покивает головой, но в итоге все равно нарисует тебе бетонную коробку, просто покрасит одну стену в чуть более светлый серый. Он не может выйти за рамки предложенного контекста, потому что твой пример стал для него точкой притяжения, из которой невозможно вырваться.

Исследователи проверили кучу фреймворков, включая те, где модели буквально орали капсом: very innovative and unlike anything seen before. Результат — нулевой. Модель игнорирует призывы к креативности, потому что математически ей проще и «безопаснее» оставаться в границах знакомых паттернов. В итоге вместо прорыва ты получаешь белый шум из перефразированных тезисов, которые формально новые, но по факту — унылая копипаста.

Этот эффект «узкого кругозора» проявляется везде: от генерации идей для стартапов до написания научного софта. Если ты даешь ChatGPT ссылки на пять популярных Telegram-каналов и просишь придумать уникальный формат, она выдаст тебе «разборы кейсов» и «советы экспертов». Она не предложит ничего радикального, потому что ее механика генерации заточена под предсказание вероятного, а не под поиск аномалий. Чем плотнее входной контекст, тем сильнее модель в нем вязнет.

Короче, пора признать: LLM — это не безумный гений, а очень старательный рефератчик. Если тебе нужно что-то по-настоящему дикое и инновационное, не надейся на промпт «будь оригинальным» — это полная фигня, которая не работает. Чтобы получить нестандартный результат, нужно либо радикально менять входные данные, либо смириться с тем, что нейронка всегда будет предлагать вариации на тему, а не создавать новые смыслы.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с