3,583 papers
arXiv:2601.12152 72 17 янв. 2026 г. FREE

Баланс контроля и автоматизации в работе с LLM-агентами: исследование креативности и чувства авторства

КЛЮЧЕВАЯ СУТЬ
Парадокс: Даёшь AI полную свободу («сделай всё сам») — экономишь 10 минут на запуске, но теряешь час на проверку, исправление ошибок и сомнения «а это вообще работает?». Исследование показало: усилия не исчезают при автоматизации, они смещаются от создания к верификации. Метод из трёх уровней контроля (Low/Medium/Intensive) позволяет выбрать баланс между скоростью генерации и чувством авторства — для разных задач нужен разный подход. Low-контроль: AI генерирует сам, ты проверяешь. Intensive-контроль: ты направляешь каждый шаг, AI оформляет. 54 участника из разных научных областей подтвердили: чем меньше контроля, тем ниже доверие к результату и меньше желания защищать идею как свою.
Адаптировать под запрос

TL;DR

Исследователи из Техасского университета изучили, как разные уровни контроля над AI-агентами влияют на креативность и чувство авторства при разработке научных предложений. Они создали систему из трёх агентов (Ideator генерирует идеи, Writer пишет текст, Evaluator оценивает) и протестировали три режима работы: Low (AI делает всё сам после стартового запроса), Medium (человек направляет, AI детализирует), Intensive (человек контролирует каждый шаг, AI помогает).

Главная находка: больше контроля ≠ лучше результат. Креативная поддержка не растёт линейно. Low-контроль даёт быстрые идеи, но низкое вовлечение. Intensive-контроль даёт глубину, но требует больших усилий. Medium где-то посередине, но не всегда лучше обоих крайних вариантов. Парадокс автоматизации: когда AI делает почти всё, качество идей часто снижается, но человек чувствует, что "работа сделана". При этом 54 участника из разных научных областей отметили: чем меньше контроля, тем больше сомнений в качестве результата и меньше желания защищать эту идею как свою.

Суть механизма: разный контроль = разное распределение труда. При низком контроле человек тратит 10% времени на запуск и 90% на проверку и исправление того, что выдал AI. При высоком контроле — 60% времени на управление процессом, 40% на проверку. Ключевой сдвиг: усилия перемещаются от генерации идей к их верификации. Вместо "придумать" люди теперь "проверить, осмыслить, решить — принять или переделать".

📌

Схема исследования

Система состоит из 3 агентов и 4 этапов:

Этапы работы:

1. Генерация идей (Ideator) → список из нескольких seed ideas
2. Выбор литературы (Writer) → релевантные статьи для контекста
3. Написание предложения (Writer) → литобзор + цели + план исследования
4. Оценка и улучшение (Evaluator) → критика + предложения → новая версия

Уровни контроля (сколько решений принимает человек):

Этап Low Medium Intensive
Генерация идей Только ключевые слова То же + выбор из вариантов + редактирование
Литература AI выбирает сам Человек выбирает направление Полный контроль
Написание AI пишет сам Промпты для секций + построчное редактирование + inline-промпты
Оценка AI улучшает сам Просмотр критики + ответы на критику + указания для улучшений
🚀

Пример применения

⚠️ Ограничения метода: Это исследование изучает СИСТЕМУ с автоматизированным workflow из трёх агентов. Прямого применения в чате ChatGPT/Claude нет. Но можно извлечь принципы для работы с AI.

Применимый принцип: Контроль процесса влияет на качество и ощущение авторства.

Задача: Ты разрабатываешь бизнес-предложение для нового продукта — скажем, сервис доставки горячих обедов для удалёнщиков в спальных районах Москвы. Нужно описать идею, изучить рынок, сформулировать УТП и план запуска.

Вариант 1 (Low-контроль — аналог исследования):

Напиши мне полное бизнес-предложение для сервиса доставки обедов 
удалённым сотрудникам в спальных районах Москвы. 

Включи:
- Анализ рынка и конкурентов
- Уникальное торговое предложение
- План запуска на первые 3 месяца
- Финансовые расчёты

Сделай максимально подробно.

Результат: AI сгенерирует полный текст на 5-10 страниц. Ты получишь готовый документ, но: - Не уверен в деталях (откуда эти цифры?) - Придётся проверять каждый факт - Ощущение "это написал AI, не я" - Много времени на верификацию

Вариант 2 (Intensive-контроль — аналог исследования):

Я разрабатываю бизнес-предложение для сервиса доставки обедов удалённым 
сотрудникам в спальных районах Москвы.

Шаг 1: Предложи 5 разных углов зрения на эту идею (ценообразование, 
логистика, маркетинг, меню, технологии).

[После ответа]

Шаг 2: Возьмём угол логистики. Задай мне 5 вопросов, ответы на которые 
помогут детализировать этот раздел.

[После ответов]

Шаг 3: На основе моих ответов составь черновик раздела про логистику. 
Без цифр, которые ты выдумал — только структура и логика.

[После черновика]

Шаг 4: Вот мои правки к твоему черновику: [вставить правки]. 
Теперь допиши финальную версию.

Результат: Процесс займёт в 3 раза больше времени, но: - Каждый тезис ты контролируешь - Чувство "это моя идея, AI помог оформить" - Меньше проверки, больше развития мысли

🧠

Почему это работает

LLM отлично генерирует связный текст, но не знает твоих целей, контекста, ограничений. Когда ты даёшь AI полную свободу (Low-контроль), он заполняет пробелы предположениями — красиво, но часто мимо. Когда ты контролируешь каждый шаг (Intensive), AI превращается в инструмент, который оформляет твои мысли, а не генерирует свои.

Парадокс усилий: кажется, что Low-контроль экономит время — одна команда, готовый результат. Но исследование показало: экономия на генерации оборачивается затратами на проверку. Участники тратили больше времени на чтение, поиск ошибок, сомнения "а это точно работает?". При Intensive-контроле времени больше, но оно идёт на созидание (думать, решать, направлять), а не на латание дыр (проверять, исправлять, переписывать).

Чувство авторства возникает не от количества написанных слов, а от принятых решений. Если ты выбрал направление, скорректировал логику, добавил свой опыт — это твоя работа, даже если AI написал 80% текста. Если ты просто скопировал output — это работа AI, даже если ты потратил час на вычитку.

Рычаги управления в твоей работе с ChatGPT/Claude:

  1. Гранулярность запроса — чем мельче шаг, тем больше контроля:

    • "Напиши всё" → AI решает за тебя
    • "Предложи структуру" → ты решаешь, AI детализирует
  2. Итеративность — одна команда vs цепочка команд:

    • Один промпт = Low-контроль
    • 5-10 промптов с корректировками = Intensive-контроль
  3. Источник данных — откуда AI берёт факты:

    • AI выдумывает → низкое доверие
    • Ты даёшь данные → высокое доверие
  4. Формат вывода — насколько готов результат:

    • Готовый текст → сложно править
    • Тезисы/структура → легко дополнить
⚠️

Ограничения

⚠️ Это исследование системы, не техника: Авторы изучали специально разработанный инструмент с тремя агентами и автоматизированным workflow. Напрямую повторить в ChatGPT/Claude нельзя — там нет параллельной работы агентов, автоматической оценки, встроенной истории версий.

⚠️ Контекст — научные предложения: Выводы протестированы на задаче написания research proposals. Для других типов контента (маркетинг, код, аналитика) баланс контроля может быть другим.

⚠️ Субъективные метрики: "Креативность", "усилия", "чувство авторства" — самооценка участников. Объективного измерения качества идей в исследовании нет.

⚠️ Эффект новизны: Участники работали с системой первый раз. При регулярном использовании паттерны могли бы измениться.

🔍

Как исследовали

Команда из Техасского университета пригласила 54 исследователя из разных областей: естественные науки, инженерия, computer science, социальные и гуманитарные науки. Каждый получил один из трёх уровней контроля (between-subjects design) и создавал research proposal в своей области за 45-60 минут.

Что измеряли: - Поведенческие метрики: сколько времени на каждом этапе, сколько правок, сколько взаимодействий с системой - Самооценка: насколько система поддержала креативность (Creativity Support Index), сколько усилий потратил (когнитивная нагрузка), кто автор идеи (ownership attribution) - Интервью: что понравилось/не понравилось, где чувствовал контроль, где чувствовал отстранённость

Сравнивали три группы (Low vs Medium vs Intensive), плюс качественный анализ записей интервью.

Ключевые находки:

  1. Креативность не растёт линейно: Low-контроль получил высокие оценки по параметру "Exploration" (помог исследовать разные направления), Intensive — по "Expressiveness" (помог выразить свои идеи). Medium застрял посередине, не лидируя ни в одном параметре.

  2. Смещение усилий: все три группы потратили примерно одинаковое общее время, но структура усилий различалась. Low-контроль: 10% на запуск, 90% на проверку и исправление. Intensive: 40% на управление агентами, 40% на проверку, 20% на планирование. Участники Low-группы чаще говорили "легко начать, трудно доверять". Intensive: "трудно начать, но я уверен в результате".

  3. Ownership — результат переговоров: те, кто назвал итоговый документ "Human work", делали акцент на оригинальности идеи ("идея моя, AI только оформил"). Те, кто назвал "AI work", подчёркивали объём автоматизированной работы ("95% текста написал AI"). Те, кто назвал "Co-Created", фокусировались на взаимодействии ("я направлял, AI генерировал, потом я корректировал — совместная работа"). Интересно: распределение этих групп было примерно одинаковым во всех трёх уровнях контроля. То есть один и тот же уровень контроля разные люди воспринимали как доминирование человека, доминирование AI или равное партнёрство.

  4. Противоречие между лёгкостью и качеством: почти все участники Low-группы отметили, что система "упростила генерацию идей", но при этом качество результата вызывало сомнения. Цитата из интервью: "Я получил готовый текст за 10 минут, но не уверен, что это хорошая идея. Мне нужно было время подумать, а система подумала за меня".

Почему результаты такие: авторы объясняют, что разные люди ценят разные аспекты креативности. Одни хотят широты (быстро посмотреть много вариантов) — для них Low-контроль идеален. Другие хотят глубины (детально проработать одну идею) — для них Intensive. Третьи хотят баланса, но Medium-контроль не гарантирует "лучшее из двух миров", а часто даёт "среднее от обоих".

Инсайт для практики: не существует универсально лучшего уровня контроля. Выбор зависит от цели: быстрый скан вариантов (Low), глубокая проработка одной идеи (Intensive), итеративное уточнение (Medium). Ошибка — использовать одинаковый подход для разных задач.

💡

Адаптации и экстраполяции

📌

🔧 Техника: Явное распределение труда

Вместо того чтобы просто давать AI задачу, сначала раздели работу на то, что делаешь ты, и что делает AI:

Я разрабатываю [твоя задача].

Моя роль:
- Сформулировать ключевые требования и ограничения
- Выбрать финальное направление из вариантов
- Добавить инсайты из моего опыта

Твоя роль:
- Предложить 3-5 вариантов структуры
- Для выбранного варианта написать черновик
- Оформить итоговый документ на основе моих правок

Начнём с первого шага: предложи варианты структуры.

Эффект: ты остаёшься автором решений, AI выполняет исполнительскую работу. Это близко к Intensive-контролю из исследования, но проще в применении — не нужно контролировать каждое предложение, только ключевые развилки.

📌

🔧 Техника: Два прохода — генерация + критика

Используй два отдельных чата для одной задачи (аналог разделения агентов Ideator/Writer и Evaluator):

Чат 1 (Генератор):

Ты — креативный генератор идей. Не критикуй, не фильтруй, просто предлагай.

Задача: [опиши задачу]

Выдай 10 разных подходов. Диких, странных, консервативных — всяких.

Чат 2 (Критик):

Ты — строгий эксперт-критик. Вот 10 идей для [задача]:

[вставить список из Чата 1]

Оцени каждую по критериям:
- Реалистичность (можно ли сделать)
- Уникальность (есть ли у конкурентов)
- Риски (что может пойти не так)

Выбери топ-3 с обоснованием.

Эффект: разделение генерации и оценки даёт более широкий спектр идей (Чат 1 не боится предлагать смелое) и объективную оценку (Чат 2 не защищает "свои" идеи). Ты выбираешь из топ-3, а не из того, что AI посчитал единственно правильным.

📌

🔧 Техника: Checkpoint-driven workflow

Встрой контрольные точки в работу с AI, где ты принимаешь решение до перехода к следующему шагу:

Задача: [опиши задачу]

Работаем поэтапно. После каждого шага — стоп, я даю фидбек.

Шаг 1: Предложи общую структуру документа.
[Жду твоего подтверждения перед Шагом 2]

После ответа AI:

ОК, структуру принял. Меняю пункт 3: вместо "Конкуренты" сделай "Рыночная ниша".

Шаг 2: Для пункта 1 "Проблема" напиши 3 варианта формулировки проблемы.
[Жду твоего выбора перед Шагом 3]

Эффект: ты сохраняешь контроль (как в Intensive), но не тратишь время на микроменеджмент каждого предложения. AI не убегает вперёд, а работает порциями, которые ты проверяешь и корректируешь.

🔗

Ресурсы

Who Owns Creativity and Who Does the Work? Trade-offs in LLM-Supported Research Ideation

Авторы: Houjiang Liu, Yujin Choi, Sanjana Gautam, Gabriel Jaffe, Soo Young Rieh, Matthew Lease

Организация: School of Information, University of Texas at Austin; Texas Advanced Computing Center

Исследование ссылается на ключевые работы: - _SciAgents_ (Wang et al.) — автоматизированная генерация идей в материаловедении - _The AI Scientist_ (Lu et al.) — полностью автономная система для проведения исследований - _IdeaSynth_ (Pu et al.) — mixed-initiative инструмент для разработки предложений - _Cocoa_ (Feng et al.) — high-steerable интерфейс для совместной работы с LLM-агентами


📋 Дайджест исследования

Ключевая суть

Парадокс: Даёшь AI полную свободу («сделай всё сам») — экономишь 10 минут на запуске, но теряешь час на проверку, исправление ошибок и сомнения «а это вообще работает?». Исследование показало: усилия не исчезают при автоматизации, они смещаются от создания к верификации. Метод из трёх уровней контроля (Low/Medium/Intensive) позволяет выбрать баланс между скоростью генерации и чувством авторства — для разных задач нужен разный подход. Low-контроль: AI генерирует сам, ты проверяешь. Intensive-контроль: ты направляешь каждый шаг, AI оформляет. 54 участника из разных научных областей подтвердили: чем меньше контроля, тем ниже доверие к результату и меньше желания защищать идею как свою.

Принцип работы

Выбирай уровень контроля под тип задачи, а не по умолчанию. Low-контроль (один промпт «сделай всё») работает для черновиков, шаблонных текстов, быстрых набросков — там где нужна скорость, а точность проверишь потом. Intensive-контроль (цепочка из 5-10 промптов, где ты корректируешь каждый шаг) нужен для экспертного контента, стратегических документов, всего где важна твоя логика и опыт. Medium — не всегда золотая середина. Иногда лучше выбрать крайность: либо быстро накидать через Low и переписать, либо сразу вести через Intensive. Попытка «немного контролировать» даёт размытый результат — ни скорости Low, ни глубины Intensive.

Почему работает

Чувство авторства возникает не от количества написанных слов, а от принятых решений. Если ты выбрал направление, скорректировал логику, добавил свой кейс — это твоя работа, даже если AI написал 80% текста. Если просто скопировал output — это работа AI, даже если потратил час на вычитку. Исследование зафиксировало сдвиг усилий: при Low-контроле человек тратит 10% времени на запуск, 90% на проверку и латание дыр. При Intensive — 60% на управление процессом (думать, решать, направлять), 40% на проверку. Время не экономится — оно перераспределяется. Вопрос: ты хочешь тратить его на созидание или на поиск косяков? Участники с высоким контролем отмечали больше вовлечённости и готовности отстаивать результат.

Когда применять

Работа с AI на задачах требующих экспертизы и креативности — бизнес-предложения, исследовательские тексты, стратегические документы, аналитика со сложным контекстом. Особенно когда результат будешь защищать перед людьми (инвесторы, коллеги, клиенты) и нужна уверенность в каждом тезисе. НЕ подходит для простых шаблонных задач где скорость важнее глубины — там Low-контроль эффективнее.

Мини-рецепт

1. Оцени задачу: Это шаблон/черновик (Low) или экспертный контент где важна твоя логика (Intensive)?
2. Low-контроль: Дай один развёрнутый промпт с контекстом: Напиши [что] для [кого], включи [раздел 1], [раздел 2], [раздел 3]. Используй [стиль/тон]. Получи результат, потрать время на проверку фактов и правку логики.
3. Intensive-контроль: Разбей на этапы: сначала Предложи 5 вариантов структуры для [задача]. Выбери лучший. Потом Для раздела [название] задай мне 5 уточняющих вопросов. Ответь. Потом На основе моих ответов составь тезисы раздела без выдуманных цифр. Дополни своими данными. Финально Оформи в связный текст.
4. Проверь ощущение: Если после генерации думаешь «хм, а это точно правильно?» — в следующий раз бери больше контроля.

Примеры

[ПЛОХО] : Напиши мне полное бизнес-предложение для запуска сервиса доставки обедов удалённым сотрудникам. Включи анализ рынка, конкурентов, финмодель, план на 3 месяца. Сделай подробно. — Получишь 10 страниц текста с красивыми цифрами, но откуда они взялись? Потратишь час на проверку каждого факта и переписывание половины.
[ХОРОШО] : Я запускаю сервис доставки обедов для удалёнщиков в спальных районах Москвы. Шаг 1: Предложи 5 углов анализа этой идеи (логистика, ценообразование, маркетинг, меню, технологии). После ответа: Возьмём логистику. Задай 5 вопросов, ответы на которые помогут детализировать раздел. Отвечаешь на вопросы своими данными. Теперь составь структуру раздела про логистику на основе моих ответов — только логика, без выдуманных цифр. Дополняешь своими кейсами. Оформи финальную версию. — Времени больше, но каждый тезис под контролем. Чувство «это моя идея, AI помог оформить».
Источник: Who Owns Creativity and Who Does the Work? Trade-offs in LLM-Supported Research Ideation
ArXiv ID: 2601.12152 | Сгенерировано: 2026-01-21 05:29

Концепты не выделены.

📖 Простыми словами

Who Owns Creativity and Who Does the Work? Trade-offs inLLM-Supported Research Ideation

arXiv: 2601.12152

Когда ты отдаешь задачу нейронке, происходит фундаментальный сдвиг в том, кто здесь на самом деле автор. Проблема в том, что LLM — это зеркало твоего контроля, а не волшебная палочка. Если ты просто кидаешь запрос и ждешь результат, нейронка начинает додумывать за тебя, заполняя пустоты своими галлюцинациями и шаблонами. В итоге получается текст, который выглядит профессионально, но внутри — пустышка без твоей искры. Исследование четко показывает: чем меньше ты вовлечен в процесс, тем быстрее ты теряешь связь с результатом и перестаешь считать его своим.

Это как если бы ты заказал художнику картину, просто сказав: «Нарисуй что-нибудь красивое». Художник нарисует, но это будет его видение, а не твое. Ты вроде как заказчик, но чувство авторства — нулевое. А теперь представь, что ты стоишь рядом и каждые пять минут говоришь: «Тут мазок поярче, здесь тень погуще». В первом случае ты получаешь кота в мешке, во втором — тратишь столько сил, что проще было бы взять кисть самому. Исследователи из Техаса нащупали этот болезненный баланс между «сделай за меня» и «помогай мне».

Ученые выделили три уровня жести: Low-контроль, где AI — это автономный комбайн, Medium, где ты задаешь вектор, и Intensive, где ты буквально ведешь нейронку за руку через три этапа — генерацию идей, написание и оценку. Выяснилось, что интенсивный контроль убивает магию скорости, но дает на выходе продукт, за который тебе не стыдно. Если AI делает всё сам, получается стерильный контент, который не решает реальных проблем, потому что машина не знает твоих скрытых целей и контекста.

Этот принцип работает везде: от написания кода до составления маркетинговых стратегий. Если ты используешь ChatGPT или Claude как «черный ящик», ты получаешь среднестатистический мусор. Но если ты разбиваешь задачу на этапы и на каждом шаге даешь обратную связь, AI превращается в мощный усилитель твоего интеллекта. SEO-тексты, научные статьи, бизнес-планы — везде работает одна и та же логика: либо ты контролируешь процесс и получаешь качество, либо экономишь время и получаешь безликую фигню.

Главный вывод прост: нельзя делегировать творчество целиком, если хочешь остаться автором. Полная автоматизация — это ловушка, которая выдает предсказуемый и скучный результат. Чтобы получить по-настоящему крутую идею, нужно использовать AI как умный молоток, а не как наемного рабочего. Либо ты тратишь время на микроменеджмент нейронки и получаешь топ-контент, либо нажимаешь кнопку «сделать красиво» и на выходе имеешь красивое ничто.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с