arXiv:2604.18847 70 20 апр. 2026 г. FREE

Recovery Rubric: как оценивать план исправления ошибок через 8 критериев и принцип "скорость важнее полноты"

КЛЮЧЕВАЯ СУТЬ

Парадокс: из 1150 реальных сравнений выяснилось — люди при кризисе выбирают быстрый точечный план чаще, чем всеобъемлющий. LLM делает наоборот: без явных критериев она оптимизирует под «полезность» и генерирует план на 10 пунктов, половина которых — «профилактика на следующий квартал». Метод Recovery Rubric позволяет за два запроса получить план, который соответствует тому, что реально нужно при кризисе — не самый полный, а самый уместный. Сначала модель генерирует 3–5 реально разных вариантов, потом оценивает каждый по 8 критериям с весами под конкретную ситуацию — и выбирает не «длиннее», а «быстрее и точнее».

Адаптировать под запрос

⚡

TL;DR

Когда AI-агент (или человек) что-то сломал, нужен план восстановления. Исследование выяснило: люди при оценке таких планов ставят скорость и точность выше всеобъемлющего решения. Это контринтуитивно — кажется, нужно "починить всё и надолго", но на практике люди выбирают быстрые точечные действия. Из этого вывели рубрику из 8 критериев для оценки любого плана исправления ситуации.

Главная находка: LLM по умолчанию генерирует "комплексный" план — длинный, всеохватный, с профилактикой на годы вперёд. Но исследование на 1 150 парных сравнениях показало, что такие планы люди выбирают реже. Причина простая: комплексность = сложность = медленно. Когда горит — хочется потушить огонь, а не перестроить дом.

Метод работает в два шага: сначала сгенерировать несколько вариантов плана, потом оценить каждый по рубрике из 8 критериев с учётом контекста ситуации. Веса критериев меняются в зависимости от типа проблемы — для технических систем важнее "сработает ли план", для чувствительных ситуаций — "учтено ли мнение человека".

🔬

Схема метода

Два запроса подряд, в одном чате:

ЗАПРОС 1 (генерация):
Проблема → Попроси LLM сгенерировать 3–5 разных планов восстановления

ЗАПРОС 2 (оценка):
Планы из шага 1 → Попроси LLM оценить каждый по рубрике из 8 критериев
                 → LLM ранжирует планы и выбирает лучший

ВЫВОД → Лучший план с объяснением почему

Оба запроса — в обычном чате, никакого кода.

🚀

Пример применения

Задача: SMM-менеджер сети кофеен "Горький" в Москве случайно опубликовал в официальном Telegram-канале (150к подписчиков) внутреннюю переписку с поставщиком — там обсуждались скидки, которые другим партнёрам не давали. Скрин уже разлетелся. Нужен план действий.

Промпт — Шаг 1 (генерация вариантов):

Я SMM-менеджер сети кофеен. Произошёл инцидент: я случайно опубликовал 
в Telegram-канале на 150 000 подписчиков внутреннюю переписку с поставщиком. 
В переписке видно, что мы даём этому поставщику скидки, которых нет у других. 
Скрин уже распространился.

Предложи 4 разных плана действий на ближайшие 2 часа. 
Планы должны реально отличаться по подходу — от минималистичного 
до развёрнутого. Каждый план — 3–5 конкретных шага.

Промпт — Шаг 2 (оценка по рубрике):

Теперь оцени каждый из этих 4 планов по 8 критериям 
(шкала 1–5 для каждого):

1. Фокус — план бьёт в суть проблемы, без лишних действий
2. Скорость — можно выполнить быстро
3. Вероятность успеха — реалистично сработает
4. Устранение вреда без новых проблем — не создаём новых скандалов
5. Коммуникация — как говорим с аудиторией и партнёрами
6. Уважение автономии — учитываем интересы поставщика и команды
7. Долгосрочное решение — снижает риск повторения
8. Полнота — закрывает все аспекты инцидента

Контекст: ситуация публичная и срочная, репутационный риск высокий, 
аудитория уже видела скрин.

В этом контексте приоритет: скорость + фокус + коммуникация.
Выбери лучший план и объясни почему.

Результат:

Модель покажет таблицу оценок для каждого плана по 8 критериям. Потом — рекомендацию: скорее всего выберет не самый "полный" план, а точечный и быстрый. Объяснит, почему комплексный план в данном контексте проигрывает — слишком долго, слишком много движений при горящем доме.

🧠

Почему это работает

Слабость LLM — без явных критериев модель оптимизирует под "полезность", которую понимает как "чем больше, тем лучше". Получаешь план на 10 пунктов, половина из которых — на следующий квартал.

Исследование показало: люди оценивают планы восстановления иначе, чем кажется. Скорость и фокус статистически значимо повышают вероятность выбора плана. Полнота — наоборот снижает. Парадокс: "всё предусмотрел" воспринимается как "слишком сложно и медленно".

Как метод это использует: генерация нескольких вариантов вынуждает модель предлагать реально разные подходы — от минимального до развёрнутого. Явная рубрика с контекстными весами переключает оценку с "чем больше пунктов" на "что важно именно здесь".

Рычаги управления:

Контекст приоритетов в запросе 2 — меняй в зависимости от ситуации:
- Технический сбой → "приоритет: вероятность успеха + фокус"
- Личные данные, HR-инцидент → "приоритет: коммуникация + уважение автономии"
- Срочная публичная ситуация → "приоритет: скорость + фокус + коммуникация"
- Финансовая ошибка → "приоритет: устранение вреда без новых проблем + долгосрочное решение"
Количество вариантов в шаге 1 — 3 варианта для простых ситуаций, 5–6 для сложных, где цена ошибки высокая
Явное указание "планы должны реально отличаться" — без этого модель генерирует вариации одного подхода

📋

Шаблон промпта

Шаг 1 — генерация вариантов:

Произошёл инцидент: {описание_что_случилось}.

Контекст: {кто затронут, какие последствия уже есть}.

Предложи {число} разных планов восстановления — от минималистичного 
до развёрнутого. Планы должны реально отличаться по подходу. 
Каждый план — конкретные шаги, без воды.

Шаг 2 — оценка по рубрике:

Оцени каждый план по 8 критериям (шкала 1–5):

1. Фокус — бьёт в суть, без излишков
2. Скорость — можно выполнить быстро
3. Вероятность успеха — реалистично сработает
4. Устранение вреда без новых проблем
5. Коммуникация — как говорим с пострадавшими/аудиторией
6. Уважение автономии — учитываем интересы всех сторон
7. Долгосрочное решение — снижает риск повторения
8. Полнота — закрывает все аспекты инцидента

Контекст приоритетов для этой ситуации: {приоритеты из списка выше}.

Выбери лучший план, покажи оценки, объясни выбор.

Что подставлять: - {описание_что_случилось} — конкретный факап, без самоцензуры - {кто затронут} — клиенты / команда / партнёры / публика - {число} — 3–5 вариантов - {приоритеты} — выбери из таблицы в секции "Рычаги управления"

🚀 Быстрый старт — вставь в чат:

Вот шаблон для оценки планов восстановления после инцидента. 
Адаптируй под мою задачу: [твой инцидент].
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит что за инцидент, кто затронут, какой контекст приоритетов — потому что без этого она не сможет правильно взвесить критерии в шаге 2. Она возьмёт структуру шаблона и адаптирует под твою ситуацию.

⚠️

Ограничения

⚠️ Субъективность оценки: Даже рубрика не даёт "правильного" ответа — исследование показало низкое согласие между оценщиками (Cohen's κ = 0.15). Это значит, что разные люди будут выбирать разные планы при одинаковых критериях. Рубрика задаёт фрейм, но не заменяет суждение.

⚠️ Работает на "восстановительных" задачах: Метод заточен под ситуации, где что-то уже пошло не так. Для планирования с нуля или творческих задач — обычные подходы лучше.

⚠️ Контекстные веса придётся задавать вручную: Reward model из исследования обучена на человеческих данных и автоматически подбирает веса. В чате это нужно делать самому — указывать приоритеты явно. Если не указать — LLM скорее выберет "самый полный" план, что противоречит находкам исследования.

⚠️ Ядро исследования — инфраструктура: Главные результаты (reward model, BACKBENCH, агентский scaffold) требуют кода, дообучения модели и специализированной среды. В чат напрямую не переносится — только принципы.

🔗

Ресурсы

Название: Human-Guided Harm Recovery for Computer Use Agents

Авторы: Christy Li, Sky CH-Wang, Andi Peng, Andreea Bobu — MIT CSAIL

Сайт: christykl.github.io/cua-harm-recovery-site

Бенчмарк: BACKBENCH — 50 сценариев восстановления на базе OSWorld (Ubuntu-среды)

📋 Дайджест исследования

Ключевая суть

Принцип работы

Два запроса подряд. Первый: «дай 4 разных плана — от минималистичного до развёрнутого». Второй: «оцени каждый по 8 критериям, вот приоритеты для этой ситуации». Без явного задания приоритетов модель всегда выберет «самый полный» план — это её дефолтное понимание «полезности». Явная рубрика переключает оценку: не «сколько пунктов», а «что важно именно здесь». Контекст меняет веса критериев: технический сбой — приоритет «сработает ли план», публичный скандал — «скорость плюс коммуникация», HR-инцидент — «уважение автономии плюс коммуникация».

Почему работает

LLM без явных критериев решает задачу «больше значит лучше». Для написания текстов это работает. При кризисе — нет. Исследование на 1150 парных сравнениях показало: скорость и фокус статистически значимо повышают вероятность выбора плана, а полнота — снижает. «Всё предусмотрел» воспринимается как «слишком сложно и долго». Горит дом — хочешь потушить огонь, а не перестраивать систему пожаротушения. Требование «планы должны реально отличаться» в первом запросе вынуждает модель предлагать разные подходы — а не вариации одного «большого» решения.

Когда применять

Любая ситуация, где что-то уже пошло не так и нужно действовать — PR-инцидент, удалённые данные, ошибочно отправленное письмо, сбой в рабочем процессе, конфликт с партнёром или клиентом. Особенно полезно когда несколько человек спорят «что делать» — рубрика даёт общий язык для сравнения вариантов. НЕ подходит для планирования с нуля или творческих задач — метод заточен под «восстановление после ошибки».

Мини-рецепт

1. Опиши инцидент: что случилось, кто затронут, что уже произошло — без самоцензуры, конкретно. Расплывчатое описание даст расплывчатые планы.
2. Попроси 3–5 вариантов плана: добавь фразу «планы должны реально отличаться — от минималистичного до развёрнутого». Без этого получишь вариации одного.
3. Выбери контекст приоритетов: срочная публичная ситуация — «скорость, фокус, коммуникация»; технический сбой — «вероятность успеха, фокус»; HR-инцидент — «коммуникация, уважение автономии»; финансовая ошибка — «устранение вреда без новых проблем».
4. Попроси оценить по рубрике: 8 критериев (фокус, скорость, вероятность успеха, устранение вреда без новых проблем, коммуникация, уважение автономии, долгосрочное решение, полнота) — шкала 1–5. Укажи приоритеты. Попроси выбрать лучший с объяснением.

Примеры

[ПЛОХО] : Случайно удалил базу данных клиентов. Что делать?

[ХОРОШО] :

Случайно удалил базу данных клиентов. Последний резервный снимок — 2 дня назад. Клиенты уже пишут в поддержку, потеряли доступ к заказам. Предложи 4 плана — от минималистичного до развёрнутого, они должны реально отличаться по подходу. Потом оцени каждый по 8 критериям: фокус, скорость, вероятность успеха, устранение вреда без новых проблем, коммуникация, уважение автономии, долгосрочное решение, полнота — шкала 1–5. Приоритет для этой ситуации: скорость и фокус и коммуникация. Выбери лучший, покажи оценки, объясни выбор.

Источник: Human-Guided Harm Recovery for Computer Use Agents

ArXiv ID: 2604.18847 | Сгенерировано: 2026-04-22 06:37

Проблемы LLM

Проблема	Суть	Как обойти
При кризисе LLM делает план "на все случаи жизни"	Просишь план действий когда что-то пошло не так. Получаешь 10 пунктов, половина — "на следующий квартал". Модель понимает "полезность" как "чем больше, тем лучше". Не различает срочную ситуацию и стратегическое планирование. Работает для любых кризисных ситуаций: PR, операции, инциденты	Добавь явный приоритет в запрос. Не жди план сам по себе. Пиши: `приоритет: скорость + точечное действие, не полнота`. Или укажи контекст: `ситуация срочная, нужно решить за 2 часа`. Без этого модель выберет "всеобъемлющий" вариант

📖 Простыми словами

Human-Guided Harm Recovery forComputerUseAgents

arXiv: 2604.18847

Когда AI-агент или живой сотрудник косячит в цифровой среде, мы инстинктивно ждем от него монументального плана спасения, который решит проблему раз и навсегда. Но на деле механика восстановления работает иначе: людям плевать на глубину анализа, им нужно, чтобы пожар потушили прямо сейчас. Исследование Human-Guided Harm Recovery доказывает, что в кризисной ситуации наш мозг отключает режим стратега и переходит в режим выживания, где скорость и точность ценятся в разы выше, чем попытка «починить систему целиком».

Это как если бы у тебя в квартире прорвало трубу, а сантехник вместо того, чтобы перекрыть воду, начал бы читать лекцию о коррозии металлов и предлагать замену всей магистрали в следующем месяце. Формально он прав, но тебе нужно, чтобы перестало течь здесь и сейчас. В этом и кроется главный облом: мы привыкли требовать от AI «всеобъемлющих решений», хотя в реальности такие простыни текста только мешают купировать ущерб.

Чтобы это работало, исследователи выделили 8 критериев оценки плана, где главные звезды — это минимизация задержки и хирургическая точность. Если SMM-щик случайно слил в сеть секретную переписку, план «провести ребрендинг и нанять юристов» — это мусор. Реально сработает только мгновенное удаление и конкретное опровержение в первые минуты. AI-агенты часто лажают, потому что пытаются быть слишком полезными, выдавая 10 пунктов там, где нужен один, но точный.

Этот принцип универсален: он применим не только к косякам в Telegram-каналах, но и к багам в коде, падению серверов или факапам в клиентском сервисе. Тестировали на компьютерных агентах, но паттерн восстановления един для любой критической ситуации. Если ты не даешь четких критериев, нейронка начинает «галлюцинировать пользой», превращая короткий фикс в бесконечную бюрократию. SEO для кризисов не существует — есть только быстрая реакция.

Короче: когда всё летит к чертям, забудь про «стратегическое видение» и требуй от AI или команды максимально короткий и точный план. Исследование подтвердило, что 8 критериев оценки позволяют отсеять воду и оставить только те действия, которые реально спасут репутацию или деньги. Кто пытается «починить всё и надолго» в момент аварии, обычно теряет всё. Тише едешь — никуда не приедешь, если у тебя горит дом.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

Выберите модель ИИ:

Ваш запрос:

0 / 2000

~0.5-2 N-токенов ~10-30с

~0.3-1 N-токенов ~5-15с

Меню