TL;DR
Исследователи из Техасского университета изучили, как разные уровни контроля над AI-агентами влияют на креативность и чувство авторства при разработке научных предложений. Они создали систему из трёх агентов (Ideator генерирует идеи, Writer пишет текст, Evaluator оценивает) и протестировали три режима работы: Low (AI делает всё сам после стартового запроса), Medium (человек направляет, AI детализирует), Intensive (человек контролирует каждый шаг, AI помогает).
Главная находка: больше контроля ≠ лучше результат. Креативная поддержка не растёт линейно. Low-контроль даёт быстрые идеи, но низкое вовлечение. Intensive-контроль даёт глубину, но требует больших усилий. Medium где-то посередине, но не всегда лучше обоих крайних вариантов. Парадокс автоматизации: когда AI делает почти всё, качество идей часто снижается, но человек чувствует, что "работа сделана". При этом 54 участника из разных научных областей отметили: чем меньше контроля, тем больше сомнений в качестве результата и меньше желания защищать эту идею как свою.
Суть механизма: разный контроль = разное распределение труда. При низком контроле человек тратит 10% времени на запуск и 90% на проверку и исправление того, что выдал AI. При высоком контроле — 60% времени на управление процессом, 40% на проверку. Ключевой сдвиг: усилия перемещаются от генерации идей к их верификации. Вместо "придумать" люди теперь "проверить, осмыслить, решить — принять или переделать".
Схема исследования
Система состоит из 3 агентов и 4 этапов:
Этапы работы:
1. Генерация идей (Ideator) → список из нескольких seed ideas
2. Выбор литературы (Writer) → релевантные статьи для контекста
3. Написание предложения (Writer) → литобзор + цели + план исследования
4. Оценка и улучшение (Evaluator) → критика + предложения → новая версия
Уровни контроля (сколько решений принимает человек):
| Этап | Low | Medium | Intensive |
|---|---|---|---|
| Генерация идей | Только ключевые слова | То же | + выбор из вариантов + редактирование |
| Литература | AI выбирает сам | Человек выбирает направление | Полный контроль |
| Написание | AI пишет сам | Промпты для секций | + построчное редактирование + inline-промпты |
| Оценка | AI улучшает сам | Просмотр критики | + ответы на критику + указания для улучшений |
Пример применения
⚠️ Ограничения метода: Это исследование изучает СИСТЕМУ с автоматизированным workflow из трёх агентов. Прямого применения в чате ChatGPT/Claude нет. Но можно извлечь принципы для работы с AI.
Применимый принцип: Контроль процесса влияет на качество и ощущение авторства.
Задача: Ты разрабатываешь бизнес-предложение для нового продукта — скажем, сервис доставки горячих обедов для удалёнщиков в спальных районах Москвы. Нужно описать идею, изучить рынок, сформулировать УТП и план запуска.
Вариант 1 (Low-контроль — аналог исследования):
Напиши мне полное бизнес-предложение для сервиса доставки обедов
удалённым сотрудникам в спальных районах Москвы.
Включи:
- Анализ рынка и конкурентов
- Уникальное торговое предложение
- План запуска на первые 3 месяца
- Финансовые расчёты
Сделай максимально подробно.
Результат: AI сгенерирует полный текст на 5-10 страниц. Ты получишь готовый документ, но: - Не уверен в деталях (откуда эти цифры?) - Придётся проверять каждый факт - Ощущение "это написал AI, не я" - Много времени на верификацию
Вариант 2 (Intensive-контроль — аналог исследования):
Я разрабатываю бизнес-предложение для сервиса доставки обедов удалённым
сотрудникам в спальных районах Москвы.
Шаг 1: Предложи 5 разных углов зрения на эту идею (ценообразование,
логистика, маркетинг, меню, технологии).
[После ответа]
Шаг 2: Возьмём угол логистики. Задай мне 5 вопросов, ответы на которые
помогут детализировать этот раздел.
[После ответов]
Шаг 3: На основе моих ответов составь черновик раздела про логистику.
Без цифр, которые ты выдумал — только структура и логика.
[После черновика]
Шаг 4: Вот мои правки к твоему черновику: [вставить правки].
Теперь допиши финальную версию.
Результат: Процесс займёт в 3 раза больше времени, но: - Каждый тезис ты контролируешь - Чувство "это моя идея, AI помог оформить" - Меньше проверки, больше развития мысли
Почему это работает
LLM отлично генерирует связный текст, но не знает твоих целей, контекста, ограничений. Когда ты даёшь AI полную свободу (Low-контроль), он заполняет пробелы предположениями — красиво, но часто мимо. Когда ты контролируешь каждый шаг (Intensive), AI превращается в инструмент, который оформляет твои мысли, а не генерирует свои.
Парадокс усилий: кажется, что Low-контроль экономит время — одна команда, готовый результат. Но исследование показало: экономия на генерации оборачивается затратами на проверку. Участники тратили больше времени на чтение, поиск ошибок, сомнения "а это точно работает?". При Intensive-контроле времени больше, но оно идёт на созидание (думать, решать, направлять), а не на латание дыр (проверять, исправлять, переписывать).
Чувство авторства возникает не от количества написанных слов, а от принятых решений. Если ты выбрал направление, скорректировал логику, добавил свой опыт — это твоя работа, даже если AI написал 80% текста. Если ты просто скопировал output — это работа AI, даже если ты потратил час на вычитку.
Рычаги управления в твоей работе с ChatGPT/Claude:
Гранулярность запроса — чем мельче шаг, тем больше контроля:
- "Напиши всё" → AI решает за тебя
- "Предложи структуру" → ты решаешь, AI детализирует
Итеративность — одна команда vs цепочка команд:
- Один промпт = Low-контроль
- 5-10 промптов с корректировками = Intensive-контроль
Источник данных — откуда AI берёт факты:
- AI выдумывает → низкое доверие
- Ты даёшь данные → высокое доверие
Формат вывода — насколько готов результат:
- Готовый текст → сложно править
- Тезисы/структура → легко дополнить
Ограничения
⚠️ Это исследование системы, не техника: Авторы изучали специально разработанный инструмент с тремя агентами и автоматизированным workflow. Напрямую повторить в ChatGPT/Claude нельзя — там нет параллельной работы агентов, автоматической оценки, встроенной истории версий.
⚠️ Контекст — научные предложения: Выводы протестированы на задаче написания research proposals. Для других типов контента (маркетинг, код, аналитика) баланс контроля может быть другим.
⚠️ Субъективные метрики: "Креативность", "усилия", "чувство авторства" — самооценка участников. Объективного измерения качества идей в исследовании нет.
⚠️ Эффект новизны: Участники работали с системой первый раз. При регулярном использовании паттерны могли бы измениться.
Как исследовали
Команда из Техасского университета пригласила 54 исследователя из разных областей: естественные науки, инженерия, computer science, социальные и гуманитарные науки. Каждый получил один из трёх уровней контроля (between-subjects design) и создавал research proposal в своей области за 45-60 минут.
Что измеряли: - Поведенческие метрики: сколько времени на каждом этапе, сколько правок, сколько взаимодействий с системой - Самооценка: насколько система поддержала креативность (Creativity Support Index), сколько усилий потратил (когнитивная нагрузка), кто автор идеи (ownership attribution) - Интервью: что понравилось/не понравилось, где чувствовал контроль, где чувствовал отстранённость
Сравнивали три группы (Low vs Medium vs Intensive), плюс качественный анализ записей интервью.
Ключевые находки:
Креативность не растёт линейно: Low-контроль получил высокие оценки по параметру "Exploration" (помог исследовать разные направления), Intensive — по "Expressiveness" (помог выразить свои идеи). Medium застрял посередине, не лидируя ни в одном параметре.
Смещение усилий: все три группы потратили примерно одинаковое общее время, но структура усилий различалась. Low-контроль: 10% на запуск, 90% на проверку и исправление. Intensive: 40% на управление агентами, 40% на проверку, 20% на планирование. Участники Low-группы чаще говорили "легко начать, трудно доверять". Intensive: "трудно начать, но я уверен в результате".
Ownership — результат переговоров: те, кто назвал итоговый документ "Human work", делали акцент на оригинальности идеи ("идея моя, AI только оформил"). Те, кто назвал "AI work", подчёркивали объём автоматизированной работы ("95% текста написал AI"). Те, кто назвал "Co-Created", фокусировались на взаимодействии ("я направлял, AI генерировал, потом я корректировал — совместная работа"). Интересно: распределение этих групп было примерно одинаковым во всех трёх уровнях контроля. То есть один и тот же уровень контроля разные люди воспринимали как доминирование человека, доминирование AI или равное партнёрство.
Противоречие между лёгкостью и качеством: почти все участники Low-группы отметили, что система "упростила генерацию идей", но при этом качество результата вызывало сомнения. Цитата из интервью: "Я получил готовый текст за 10 минут, но не уверен, что это хорошая идея. Мне нужно было время подумать, а система подумала за меня".
Почему результаты такие: авторы объясняют, что разные люди ценят разные аспекты креативности. Одни хотят широты (быстро посмотреть много вариантов) — для них Low-контроль идеален. Другие хотят глубины (детально проработать одну идею) — для них Intensive. Третьи хотят баланса, но Medium-контроль не гарантирует "лучшее из двух миров", а часто даёт "среднее от обоих".
Инсайт для практики: не существует универсально лучшего уровня контроля. Выбор зависит от цели: быстрый скан вариантов (Low), глубокая проработка одной идеи (Intensive), итеративное уточнение (Medium). Ошибка — использовать одинаковый подход для разных задач.
Адаптации и экстраполяции
🔧 Техника: Явное распределение труда
Вместо того чтобы просто давать AI задачу, сначала раздели работу на то, что делаешь ты, и что делает AI:
Я разрабатываю [твоя задача].
Моя роль:
- Сформулировать ключевые требования и ограничения
- Выбрать финальное направление из вариантов
- Добавить инсайты из моего опыта
Твоя роль:
- Предложить 3-5 вариантов структуры
- Для выбранного варианта написать черновик
- Оформить итоговый документ на основе моих правок
Начнём с первого шага: предложи варианты структуры.
Эффект: ты остаёшься автором решений, AI выполняет исполнительскую работу. Это близко к Intensive-контролю из исследования, но проще в применении — не нужно контролировать каждое предложение, только ключевые развилки.
🔧 Техника: Два прохода — генерация + критика
Используй два отдельных чата для одной задачи (аналог разделения агентов Ideator/Writer и Evaluator):
Чат 1 (Генератор):
Ты — креативный генератор идей. Не критикуй, не фильтруй, просто предлагай.
Задача: [опиши задачу]
Выдай 10 разных подходов. Диких, странных, консервативных — всяких.
Чат 2 (Критик):
Ты — строгий эксперт-критик. Вот 10 идей для [задача]:
[вставить список из Чата 1]
Оцени каждую по критериям:
- Реалистичность (можно ли сделать)
- Уникальность (есть ли у конкурентов)
- Риски (что может пойти не так)
Выбери топ-3 с обоснованием.
Эффект: разделение генерации и оценки даёт более широкий спектр идей (Чат 1 не боится предлагать смелое) и объективную оценку (Чат 2 не защищает "свои" идеи). Ты выбираешь из топ-3, а не из того, что AI посчитал единственно правильным.
🔧 Техника: Checkpoint-driven workflow
Встрой контрольные точки в работу с AI, где ты принимаешь решение до перехода к следующему шагу:
Задача: [опиши задачу]
Работаем поэтапно. После каждого шага — стоп, я даю фидбек.
Шаг 1: Предложи общую структуру документа.
[Жду твоего подтверждения перед Шагом 2]
После ответа AI:
ОК, структуру принял. Меняю пункт 3: вместо "Конкуренты" сделай "Рыночная ниша".
Шаг 2: Для пункта 1 "Проблема" напиши 3 варианта формулировки проблемы.
[Жду твоего выбора перед Шагом 3]
Эффект: ты сохраняешь контроль (как в Intensive), но не тратишь время на микроменеджмент каждого предложения. AI не убегает вперёд, а работает порциями, которые ты проверяешь и корректируешь.
Ресурсы
Who Owns Creativity and Who Does the Work? Trade-offs in LLM-Supported Research Ideation
Авторы: Houjiang Liu, Yujin Choi, Sanjana Gautam, Gabriel Jaffe, Soo Young Rieh, Matthew Lease
Организация: School of Information, University of Texas at Austin; Texas Advanced Computing Center
Исследование ссылается на ключевые работы: - _SciAgents_ (Wang et al.) — автоматизированная генерация идей в материаловедении - _The AI Scientist_ (Lu et al.) — полностью автономная система для проведения исследований - _IdeaSynth_ (Pu et al.) — mixed-initiative инструмент для разработки предложений - _Cocoa_ (Feng et al.) — high-steerable интерфейс для совместной работы с LLM-агентами
