3,583 papers
arXiv:2606.28749 74 27 июня 2026 г. FREE

Четыре типа работы с LLM: почему самые думающие пользователи выглядят "слабейшими" по всем метрикам

КЛЮЧЕВАЯ СУТЬ
Исследователи опросили 382 студента и обнаружили четыре качественно разных способа работать с AI — не по частоте, а по тому, кто контролирует мышление: человек или модель. Это не шкала "использует много / мало". Это принципиально разные отношения с инструментом: один человек спрашивает у GPT "напиши мне аргумент", другой — уже написал аргумент сам и спрашивает "где я ошибаюсь". Оба активно используют AI. Только первый деградирует, второй — растёт.
Адаптировать под запрос

TL;DR

Исследователи опросили 382 студента и обнаружили четыре качественно разных способа работать с AI — не по частоте, а по тому, кто контролирует мышление: человек или модель. Это не шкала "использует много / мало". Это принципиально разные отношения с инструментом: один человек спрашивает у GPT "напиши мне аргумент", другой — уже написал аргумент сам и спрашивает "где я ошибаюсь". Оба активно используют AI. Только первый деградирует, второй — растёт.

Главный парадокс: самые грамотные пользователи AI — те, кто сохраняет контроль над собственным мышлением — набирают меньше всего баллов по всем стандартным метрикам "эффективности AI". Не потому что работают хуже. А потому что шкалы измеряют не качество работы, а долю AI в результате. Чем меньше ты отдаёшь модели — тем "ниже твой балл". Это фундаментальный изъян в том, как мы оцениваем "хорошее использование AI".

Исследование вводит два независимых механизма: грамотность в AI определяет, КАК ты используешь модель (какой тип поведения), а мотивационные убеждения определяют, НАСКОЛЬКО ИНТЕНСИВНО ты на неё опираешься. Это разные рычаги — и работать с ними нужно отдельно.


🔬

Схема метода

Четыре типа выстроены по двум осям:

                          КРИТИЧЕСКАЯ ОЦЕНКА AI-вывода
                          Низкая          Высокая
                     ┌──────────────┬──────────────────┐
Высокий              │  Dialogic    │   Strategic      │
АВТОРСКИЙ            │  (30.4%)     │   (34.3%)        │
КОНТРОЛЬ             │  думаем      │   думаем +        │
                     │  вместе с AI │   проверяем AI   │
                     ├──────────────┼──────────────────┤
Низкий               │  Dependent   │  Instrumental    │
АВТОРСКИЙ            │  (4.5%)      │  (30.9%)         │
КОНТРОЛЬ             │  AI думает   │  AI выполняет    │
                     │  за меня     │  конкретные      │
                     │              │  техзадачи       │
                     └──────────────┴──────────────────┘

Strategic — человек написал сам, просит AI проверить тезис, найти слабые места, оспорить. Dialogic — думает вслух вместе с AI, развивает идеи через диалог, но авторство — своё. Instrumental — делегирует конкретные рутинные задачи: грамматика, форматирование, поиск ссылки. Dependent — открывает чат в начале работы и строит весь текст на выводе модели.

Все шаги выполняются в обычном диалоге с моделью — никаких специальных инструментов.


🚀

Пример применения

Задача: Пишешь разбор для Telegram-канала — "Почему российские EdTech-стартапы не масштабируются за рубеж". Уже набросал тезисы. Хочешь сделать текст сильнее.

Dependent-подход (как не надо):

Напиши статью о том, почему российские EdTech-стартапы 
не масштабируются за рубеж. Аргументы, структура, вывод.

Strategic-подход — ты держишь мышление у себя:

Я написал тезис для статьи: «Российские EdTech-стартапы 
не масштабируются за рубеж из-за product-market fit под 
локальный менталитет — они строят под "ЕГЭ-логику", 
которой нет в западных системах образования».

Твоя задача — не соглашаться. Найди:
1. Контрпримеры: кто из российских EdTech всё же зашёл 
   на международный рынок и как
2. Альтернативные объяснения: что ещё могло быть 
   причиной, кроме product-market fit
3. Логические дыры в моём тезисе

НЕ переписывай тезис. Только оппонируй.

Dialogic-подход — думаешь вместе, но своим мозгом:

Я пытаюсь понять вот что: российские EdTech (Skyeng, 
Учи.ру, Яндекс.Учебник) очень успешны локально, 
но почти не видны глобально. У меня есть несколько 
конкурирующих объяснений, я не уверен какое правильнее.

Объяснение А: проблема продукта — он заточен под 
российскую образовательную систему.
Объяснение Б: проблема капитала — нет денег на 
международное масштабирование.
Объяснение В: проблема времени — санкции отрезали 
выход именно тогда, когда были готовы расти.

Помоги мне разобраться: какое объяснение сильнее 
подкреплено логикой и что мне стоит проверить?

Результат: В Strategic-варианте модель выдаст конкретные контрпримеры и возражения — ты получишь материал для усиления собственного аргумента, не готовый текст. В Dialogic-варианте модель разберёт три версии, укажет на логические преимущества каждой и подскажет, что искать дальше. Твои идеи станут точнее, потому что ты думал — AI просто создавал сопротивление и задавал вопросы.


🧠

Почему это работает

Слабость LLM и слабость пользователя — взаимно усиливают друг друга. Модель отлично генерирует связный, убедительно звучащий текст. Когда ты открываешь чат и просишь "напиши", ты получаешь статистически среднее — гладко, но предсказуемо. Мозг при этом выключается: исследование фиксирует снижение нейронной связности на 55% у тех, кто пишет с AI против тех, кто без. 83% не могли вспомнить фрагменты эссе, которые только что "написали" с помощью AI.

Разница между типами — не количество промптов, а где происходит мышление. Dependent-пользователь использует AI как генератор идей. Strategic-пользователь использует AI как оппонента для своих идей. Первый постепенно теряет способность думать самостоятельно. Второй — укрепляет её. Внешне оба "активно используют AI".

Ключевой рычаг — вопрос "кто формулирует проблему". Если ты приходишь в чат с уже сформулированной позицией и просишь AI её оспорить — ты Strategic. Если ты приходишь с пустым листом и просишь AI заполнить его — ты Dependent. Разница в одном: сделал ли ты интеллектуальную работу до того, как открыл чат.


📋

Шаблон промпта

📌

Strategic-режим (проверка и оппонирование)

Вот мой тезис / вывод / аргумент:
[твой текст]

Твоя задача — не соглашаться и не улучшать формулировку.
Найди:
— Контрпримеры, которые опровергают мой тезис
— Альтернативные объяснения, которые я не рассмотрел
— Логические слабости или допущения, которые я принял 
  за само собой разумеющееся

НЕ переписывай. Только атакуй.

Что подставлять: в {твой текст} — любой тезис, вывод, план, решение, которое ты уже сформулировал сам. Чем точнее формулировка — тем острее оппонирование.


📌

Dialogic-режим (развитие мышления через диалог)

Я разбираюсь в вопросе: {тема}

У меня несколько конкурирующих объяснений, я не уверен 
какое точнее:

Версия А: {объяснение 1}
Версия Б: {объяснение 2}  
Версия В: {объяснение 3}

Помоги разобраться:
1. Какая версия логически сильнее и почему
2. Что мне нужно проверить или найти, чтобы выбрать между ними
3. Какую версию я не рассмотрел

Не давай финального ответа — задавай вопросы и указывай 
на то, что стоит проверить.

Что подставлять: {тема} — любой вопрос, в котором ты разбираешься. Версии — три своие гипотезы. Главное: версии формулируешь ты, не просишь AI сгенерировать.


🚀 Быстрый старт — вставь в чат:

Вот шаблон Strategic-режима работы с AI. 
Адаптируй под мою задачу: {твоя задача}. 
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит, какой тезис или вывод ты хочешь проверить — потому что метод работает только если ты уже что-то сформулировал сам.


⚠️

Ограничения

⚠️ Это исследование, не техника: Статья описывает паттерны поведения, а не готовый метод. Нет алгоритма "сделай 1-2-3 и получишь результат X". Шаблоны выше — моя интерпретация, как операционализировать типы в реальных промптах.

⚠️ Типы не жёсткие: Один и тот же человек может использовать Dependent для черновика и Strategic для финальной проверки. Это не диагноз, а описание поведения в конкретный момент.

⚠️ 13% вне модели: Примерно каждый седьмой пользователь принципиально ограничивает AI по этическим соображениям — не из-за неумения и не из-за низкой мотивации. Для них все нижеизложенные рекомендации нерелевантны.

⚠️ Контекст — академическое письмо: Исследование про студентов и письменные работы. Для других задач (анализ данных, код, дизайн) соотношение типов и их последствия могут быть другими.


🔗

Ресурсы

Статья: Four Types of LLM Reliance and Their Predictors Among Undergraduate Writers: A Mixed-Methods Study at a Minority-Serving R1 University

Автор: Shahin Hossain, School of Education, University of Maryland, Baltimore County (UMBC)

Ключевые теоретические основы в статье: - AI Literacy Framework — Long & Magerko (2020); Allen & Kendeou (2024) - Expectancy-Value Theory — Wigfield & Eccles (2000) - Presage-Process-Product Model — Biggs (1993) - Когнитивный долг от AI — Kosmyna et al. (2025) - Метакогнитивная лень — Fan et al. (2025)


Проблемы LLM

ПроблемаСутьКак обойти
Запрос "напиши за меня" отключает мышлениеКогда просишь модель сгенерировать текст с нуля — получаешь статистически средний результат. Твой мозг при этом не работает. Ты стал редактором чужого текста, не автором. Проблема не в качестве вывода. Проблема в том, что ты перестал думатьСначала сформулируй тезис сам. Потом открывай чат. Задача модели — атаковать твою мысль, а не порождать чужую

Методы

МетодСуть
Стратегический режим — модель как оппонентСначала пишешь тезис сам. Потом просишь модель найти в нём слабости. Запрос: Вот мой тезис: [твой текст]. Найди контрпримеры. Найди альтернативные объяснения. Найди логические дыры. Не улучшай — только атакуй. Почему работает: Модель создаёт сопротивление твоей идее, а не заменяет её. Ты получаешь материал для усиления — не готовый результат. Когда применять: есть черновик, тезис, план — любая своя формулировка. Не работает: если мысли ещё нет — сначала думай сам
Диалогический режим — модель как арбитр гипотезФормулируешь три своих версии ответа на вопрос. Просишь модель помочь выбрать. Запрос: Я разбираюсь в вопросе: [тема]. У меня три версии: А — [объяснение], Б — [объяснение], В — [объяснение]. Какая логически сильнее? Что мне проверить чтобы выбрать? Не давай финального ответа — задавай вопросы. Почему работает: Версии формулируешь ты. Мышление остаётся у тебя. Модель только указывает на слабые места и пробелы. Когда применять: нужно разобраться в вопросе, есть несколько конкурирующих гипотез. Не работает: если версий ещё нет — сначала придумай хотя бы две

Тезисы

ТезисКомментарий
Кто формулирует вопрос — тот и думаетЕсли ты пришёл в чат с уже готовым тезисом и просишь его проверить — ты думаешь. Если пришёл с пустым листом и просишь заполнить — думает модель. Внешне оба "используют AI". Но у первого мышление развивается, у второго — атрофируется. Применяй: сделай интеллектуальную работу до того, как откроешь чат. Хотя бы напиши черновой тезис от руки
📖 Простыми словами

Four Types ofLLMReliance and Their Predictors Among Undergraduate Writers: A Mixed-Methods Study at a Minority-Serving R1 University

arXiv: 2606.28749

Суть в том, что использование нейросетей — это не шкала «мало или много», а вопрос того, кто в этой связке главный. Исследователи копнули под капот студенческих работ и поняли: контроль над мышлением важнее количества сгенерированных токенов. Если ты отдаешь модели право формулировать смыслы, ты не просто экономишь время, ты делегируешь ей свой интеллект. LLM работают как статистическое зеркало: они выдают усредненную норму, которая звучит убедительно, но лишена глубины, и если ты не ведешь процесс, то просто тонешь в этом «гладком» болоте.

Это как езда на автомобиле с автопилотом: можно держать руки на руле и использовать систему как страховку, а можно пересесть на заднее сиденье и лечь спать. В первом случае ты доедешь быстрее и меньше устанешь, во втором — любая нестандартная ситуация на дороге превратит тебя в пассажира неуправляемого снаряда. Формально ты в пункте назначения, но по факту ты не контролировал процесс и ничему не научился, а при малейшем сбое системы окажешься в кювете, не понимая, что пошло не так.

Ученые выделили четыре типа отношений с AI, где ключевым фактором стал вектор инициативы. Есть те, кто использует модель как критика (сначала пишу сам, потом прошу найти дыры в логике), и те, кто юзает её как генератор смыслов (прошу придумать аргументы за меня). Разница колоссальна: у вторых нейронная связность падает на 55%, а 83% испытуемых вообще не могли вспомнить, что именно они «написали» пять минут назад. Это не работа с инструментом, это когнитивный аутсорсинг, который превращает автора в простого оператора копипасты.

Хотя тестировали это на студентах, принцип интеллектуальной зависимости применим к любому созданию контента — от кода до маркетинговых стратегий. Если ты просишь ChatGPT «написать пост про EdTech», ты получаешь стерильный мусор. Если ты скармливаешь ему свои тезисы и просишь атаковать их слабые места, ты используешь мощь модели для усиления своего мозга. SEO для смыслов больше не работает — выигрывает тот, кто сохраняет авторскую субъектность, используя AI как тренажер, а не как костыль.

Короче: если ты не можешь пересказать текст, который тебе помог написать AI, значит, ты его не писал, а просто присутствовал при его рождении. Главный риск здесь не в том, что нейросети станут слишком умными, а в том, что люди станут слишком ленивыми, чтобы проверять их галлюцинации. Либо ты используешь AI для проверки гипотез, либо AI использует тебя для легализации своего бреда. Кто сохранит контроль над логикой, тот и останется востребованным экспертом, остальные превратятся в белковые прослойки между чат-ботом и кнопкой «опубликовать».

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с