3,583 papers
arXiv:2605.16933 76 16 мая 2026 г. FREE

Feedback Depth: почему «найди проблему, но не решай» работает быстрее, чем «объясни всё подробно»

КЛЮЧЕВАЯ СУТЬ
Подробный фидбек хуже краткого — и это проверено на 3000+ реальных задачах. LLM по умолчанию выдаёт «вот проблема, вот почему, вот как исправить» — и именно это замедляет работу. Метод диагностического запроса позволяет получать точную обратную связь по тексту, идее или структуре без информационной перегрузки. Фишка: попроси модель только описать что не так — без советов как чинить. Человек сам приходит к решению быстрее, потому что задача ясна, а голова не занята чужим планом исправлений.
Адаптировать под запрос

TL;DR

Когда просишь LLM дать обратную связь, уровень детализации подсказки меняет результат. Исследование проверило три структуры фидбека на 3000+ реальных задачах: «найди все проблемы и объясни как исправить» дало самый слабый эффект, а «только опиши что не так, без решений» — один из лучших.

Проблема в том, что LLM по умолчанию выдаёт обстоятельный, многослойный фидбек: вот ошибка, вот почему она возникла, вот как исправить, и ещё две такие же. Это создаёт перегрузку: человек видит три проблемы с инструкциями и теряет фокус. Итог — больше попыток, дольше к решению.

Исследование сравнило три подхода: общий фидбек (до 3 проблем + объяснение + как исправить), фокусированный (1 проблема + объяснение + следующий шаг), диагностический (до 3 проблем, только описание — без подсказок решения). Диагностический фидбек дал меньше всего попыток до правильного ответа, фокусированный — быстрейшее время решения. Подробный общий — слабее обоих.


🔬

Схема метода

Три варианта структуры запроса на фидбек — выбирай под задачу:

ДИАГНОСТИЧЕСКИЙ (меньше попыток):
Запрос → "Найди до 3 проблем. Только опиши что не так — без советов как исправить"
Результат → список формулировок проблем

ФОКУСИРОВАННЫЙ (быстрее к решению):
Запрос → "Найди самую важную проблему. Объясни что не так и дай один конкретный следующий шаг"
Результат → разбор одной проблемы + направление

ОБЩИЙ (стандартный, но слабее):
Запрос → "Найди до 3 проблем, объясни каждую и расскажи как исправить"
Результат → подробный разбор всех проблем (информационная перегрузка)

Все три работают в одном запросе, без дополнительных шагов.


🚀

Пример применения

Задача: Ты написал описание курса по финансовой грамотности для Stepik. Хочешь, чтобы LLM нашла слабые места — но не переписывала сама, а помогла тебе додуматься.

Промпт (диагностический вариант):

Перед тобой описание онлайн-курса для страницы на Stepik. 

Найди до 3 проблем в этом тексте с точки зрения того, 
почему потенциальный студент может не записаться. 
Для каждой проблемы: только опиши что именно не работает 
и почему это отталкивает. Не давай советов как исправить — 
только диагноз.

[вставить текст описания курса]

Результат: Модель выдаст 2-3 чётких формулировки проблем в формате "вот что не так и почему это создаёт барьер для читателя". Без инструкций по правке. Ты сам решаешь что и как исправить — и делаешь это быстрее, потому что задача ясна, но голова не перегружена чужими решениями.


🧠

Почему это работает

Слабость LLM — она не знает, сколько информации тебе нужно. Спроси "дай полный фидбек" — получишь всё что знает: три проблемы, объяснения, примеры, как исправить. Это не плохо само по себе, но три проблемы с инструкциями = три задачи одновременно. Человек начинает распределять внимание и буксует.

Сильная сторона LLM — она хорошо видит паттерны и может локализовать проблему, не предлагая решения. Это редко используют, потому что привычка — просить сразу "найди и исправь".

Как метод использует это — диагностический запрос снимает с LLM задачу придумывать решение. Модель концентрируется на точном описании проблемы. Ты получаешь ясный диагноз без чужого лечения — и сам идёшь к решению быстрее, потому что понимаешь, куда смотреть.

Рычаги управления: - Количество проблем → попроси найти только 1 — получишь максимальный фокус, быстрее к решению - «Только диагноз» → убери это ограничение, если хочешь сразу и идеи по правке - Уровень твоей экспертизы → чем лучше разбираешься в теме, тем больше тебе подходит диагностический вариант; если тема незнакома — бери фокусированный с одним шагом


📋

Шаблон промпта

Перед тобой {что это: текст / структура / идея / план}.

{Выбери один вариант:}

→ ДИАГНОСТИЧЕСКИЙ: 
Найди до {2-3} проблем в {том, что нужно проверить} 
с точки зрения {критерий оценки: убедительности / ясности / логики / продаж}.
Для каждой проблемы опиши только что именно не работает и почему. 
Без советов как исправить — только диагноз.

→ ФОКУСИРОВАННЫЙ:
Найди самую важную проблему в {том, что нужно проверить}
с точки зрения {критерий}.
Объясни что именно не так, почему это проблема, 
и дай один конкретный следующий шаг.

{вставь свой текст / материал}

Что подставлять: - {что это} — лендинг, питч, резюме, план статьи, структура курса - {критерий оценки} — с чьей точки зрения смотреть: инвестора, читателя, HR, клиента - {2-3} — количество проблем: меньше = быстрее и фокуснее

🚀 Быстрый старт — вставь в чат:

Вот шаблон для диагностического фидбека на мою работу. 
Адаптируй под мою задачу: {опиши свою задачу}.
Задавай вопросы, чтобы заполнить нужные поля.

[вставить шаблон выше]

LLM спросит что именно проверить и с какой точки зрения смотреть — потому что без критерия оценки диагноз будет размытым. Она возьмёт структуру из шаблона и адаптирует под твою задачу.


⚠️

Ограничения

⚠️ Уровень экспертизы меняет результат: Новички в теме почти не выигрывают от фокусированного подхода (1 проблема) — им нужен контекст для понимания. Чем лучше ты разбираешься в предмете, тем эффективнее диагностический вариант.

⚠️ Давность данных: Если просишь фидбек по теме, которая появилась после даты обучения модели (например, новый инструмент, вышедший в 2024), — диагностический тип работает лучше. Общий фидбек с конкретными советами "как исправить" может опираться на устаревшие версии и давать некорректные инструкции.

⚠️ Разброс по задачам высокий: Средние эффекты убедительны, но индивидуальный результат варьируется сильно. Один и тот же тип фидбека помогает одним людям значительно, другим — почти не заметен.

⚠️ Контекст — программирование: Исследование проводилось на задачах веб-разработки. Для субъективных задач (оценить стиль, тон, эстетику) эффект может быть другим.


🔗

Ресурсы

The Effects of Structured LLM-Generated Feedback on Programming Assignment Performance Tsvetomila Mihaylova, Evanfiya Logacheva, Arto Hellas, Jing Fan, Francisco Castro, Bita Akram, Narges Norouzi, Peter Brusilovsky, Juho Leinonen Aalto University (Dept. of Computer Science), New York University, North Carolina State University, UC Berkeley, University of Pittsburgh Контакт: tsvetomila.mihaylova@aalto.fi

Связанные концепции: expertise reversal effect (Kalyuga, 2007), cognitive load in feedback design (Xiao et al., 2024)


📋 Дайджест исследования

Ключевая суть

Подробный фидбек хуже краткого — и это проверено на 3000+ реальных задачах. LLM по умолчанию выдаёт «вот проблема, вот почему, вот как исправить» — и именно это замедляет работу. Метод диагностического запроса позволяет получать точную обратную связь по тексту, идее или структуре без информационной перегрузки. Фишка: попроси модель только описать что не так — без советов как чинить. Человек сам приходит к решению быстрее, потому что задача ясна, а голова не занята чужим планом исправлений.

Принцип работы

Стандартный запрос на фидбек: «найди ошибки и объясни как исправить». Получаешь три проблемы с тремя инструкциями — это три задачи разом. Мозг распределяет внимание между задачами и буксует — это называется когнитивная перегрузка. Диагностический запрос убирает инструкции: только описать что не так и почему. Одна задача — понять что сломано. Как чинить — решаешь сам. И приходишь к ответу быстрее.

Почему работает

На 3153 парах задача-студент фокусированный фидбек (одна проблема + один следующий шаг) дал самое быстрое время решения. Диагностический (до трёх проблем, только описание, без советов) — меньше всего попыток до правильного ответа. Подробный общий фидбек проиграл обоим: три проблемы с инструкциями — слишком много для головы одновременно. Чем лучше разбираешься в теме, тем больше выигрываешь от диагностического варианта — тебе не нужен чужой план, тебе нужен точный диагноз.

Когда применять

Любой запрос на обратную связь по собственной работе — текст лендинга, питч для инвестора, структура статьи, план курса, описание вакансии — особенно когда разбираешься в теме и хочешь додуматься сам, а не получить готовое решение от модели. НЕ подходит: когда тема совсем незнакома — тогда бери фокусированный вариант с одной проблемой и одним следующим шагом, иначе диагноз без контекста не поможет.

Мини-рецепт

1. Выбери критерий: с чьей точки зрения оценивать — читатель, инвестор, потенциальный покупатель, HR. Без критерия диагноз будет размытым — модель не знает на что смотреть.
2. Задай формат «только диагноз»: «Найди до 2-3 проблем. Для каждой опиши только что именно не работает и почему. Без советов как исправить.»
3. Выбери число проблем под задачу: одна проблема — максимальный фокус и скорость к решению; две-три — если хочешь видеть картину шире.
4. Получи список диагнозов — и иди к решению сам: модель описала что сломано, ты решаешь как чинить.

Примеры

[ПЛОХО] : Прочитай мой питч и скажи что улучшить
[ХОРОШО] : Найди до 2 проблем в этом питче с точки зрения инвестора на посевном раунде (первые вложения в стартап). Для каждой проблемы: только опиши что именно не работает и почему это вызывает сомнения. Без советов как исправить — только диагноз. [текст питча]
Источник: The Effects of Structured LLM-Generated Feedback on Programming Assignment Performance
ArXiv ID: 2605.16933 | Сгенерировано: 2026-05-19 05:47

Проблемы LLM

ПроблемаСутьКак обойти
LLM даёт слишком много фидбека по умолчаниюПросишь "найди проблемы" — получаешь всё сразу: что не так, почему так вышло, как исправить. По каждой проблеме. Это не баг и не злой умысел. Модель просто не знает сколько тебе нужно. Итог: три проблемы с инструкциями = три задачи одновременно. Внимание рассеивается. К решению идёшь дольшеЯвно ограничь глубину ответа в запросе. Скажи: "только опиши что не так — без советов как исправить". Или: "найди одну самую важную проблему и дай один шаг". Без этого ограничения модель всегда даёт максимум

Методы

МетодСуть
Диагностический запрос — только описание, без решенийВместо "найди проблемы и скажи как исправить" пиши: Найди до 3 проблем. Для каждой опиши только что не работает и почему. Без советов как исправить — только диагноз. Модель концентрируется на точной формулировке проблемы. Ты получаешь ясный список "что болит" — и сам идёшь к решению. Почему работает: Когда ты убираешь задачу "придумай решение", модель тратит всё внимание на точное описание. Плюс ты не перегружен чужими инструкциями — видишь проблему и думаешь сам. Вариант с максимальным фокусом: Найди самую важную проблему. Объясни что не так и дай один конкретный следующий шаг. — работает когда нужно быстро тронуться с места. Когда применять: просишь фидбек на текст, идею, структуру, план. Ты достаточно разбираешься в теме чтобы самому додуматься до решения. Когда не подходит: тема совсем незнакома — тогда нужны подсказки по решению, иначе диагноз не поможет
📖 Простыми словами

The Effects of StructuredLLM-Generated Feedback on Programming Assignment Performance

arXiv: 2605.16933

Когда ты просишь нейронку проверить твой код или текст, она работает не как учитель, а как гиперопекающая нянька. Проблема в самой механике LLM: она стремится быть максимально полезной и вываливает на тебя всё сразу — ошибки, объяснения и готовые решения. В итоге твой мозг просто отключается. Вместо того чтобы анализировать проблему, ты копипастишь готовый кусок, так и не поняв, где именно накосячил в логике.

Это как если бы ты пришел в спортзал, а тренер вместо того, чтобы поправить твой хват, сам доделал за тебя подход. Вроде бы штанга поднята, но мышцы у тебя не выросли. Исследование на 3000 задач четко показало: когда модель дает полный расклад «проблема + решение», результат оказывается самым слабым. Ты не учишься, ты просто потребляешь готовый продукт, теряя фокус на главном.

Самый сок в том, что лучше всего сработал метод чистого описания: нейронка просто говорит, что не так, но не дает правильный ответ. Это заставляет тебя включить голову и самому искать выход. Конкретика в духе «опиши только проблему» или «дай намек» бьет общие запросы типа «проверь мой код» в пух и прах. Ограничение информации здесь — не баг, а фича, которая заставляет тебя прогрессировать.

Хотя тест проводили на программистах, этот принцип универсален. Если ты пишешь сценарий, статью или прогрев для курса, не проси нейронку «сделать лучше». Проси её найти логические дыры или слабые места, но запрети предлагать правки. Это работает везде, где нужно не просто закрыть задачу, а выдать качественный продукт, за который тебе не будет стыдно.

Короче: хватит кормить себя с ложечки готовыми ответами от AI. Хочешь реального роста — используй структурированный фидбек без решений. Ставь модели жесткие рамки: пусть она будет твоим критиком, а не корректором. Кто научится дозировать помощь нейронки, тот и станет умнее машины, остальные так и будут плодить посредственный контент по чужим шаблонам.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с