3,583 papers
arXiv:2603.16112 72 17 мар. 2026 г. FREE

ASDA: превращение ошибок LLM в обучающие инструкции для будущих задач

КЛЮЧЕВАЯ СУТЬ
Проблема: LLM проваливает экспертные задачи не потому что не знает методов — она знает пять и берёт не тот. Это проблема выбора, а не знания. Метод ASDA позволяет превращать каждый такой провал в структурированный файл навыка, который вставляется в промпт при похожих задачах. Вместо одного монолитного промпта — модульная библиотека: один тип ошибки = один файл с алгоритмом и чёткими триггерами «когда применять». Модель перестаёт угадывать метод и начинает идти по процедуре. Самостоятельный анализ своих провалов вручную даёт 73% от прироста полной автоматической системы с отдельным «учителем» — и это без дообучения.
Адаптировать под запрос

TL;DR

ASDA — техника, которая заставляет LLM анализировать свои провалы и превращать их в структурированные «файлы навыков» (skill files). Эти файлы потом вставляются в промпт при схожих задачах — и модель уже знает, какой метод применить и каких ошибок избегать.

Финансовые задачи (и любые многошаговые экспертные расчёты) ломают LLM по одной причине: модель не знает, какой именно метод выбрать в конкретном контексте. Она знает много методов, но путает их применение — как студент, который выучил все формулы, но не понимает, когда какую использовать. Стандартные подходы пытаются улучшить один большой системный промпт — это не работает, потому что разные типы задач требуют разного знания.

ASDA решает это через разделение: для каждого типа ошибки в каждом разделе предметной области создаётся отдельный файл навыка с чётким описанием «когда применять», пошаговой процедурой и разобранным примером. При новом вопросе нужный файл вставляется в промпт — не монолитная инструкция, а точечная инъекция знания.


🔬

Схема метода

(Полная система требует автоматизации. Ниже — оба уровня: что делает ASDA целиком и что можно повторить вручную.)

ПОЛНАЯ СИСТЕМА (автоматизированная):

ШАГ 1: Запускаем задачи → получаем неверные ответы от «студента»
ШАГ 2: «Учитель» анализирует каждый провал → классифицирует тип ошибки
ШАГ 3: Группируем ошибки по [тема × тип ошибки] → создаём skill-файлы
ШАГ 4: Итерация — тестируем skill-файлы → чиним пробелы → убираем регрессии
ШАГ 5: При новом вопросе → выбираем нужный skill-файл → вставляем в промпт

ВРУЧНУЮ В ЧАТЕ (extractable версия):

ШАГ 1 (один запрос): Даём задачу → LLM отвечает неверно
ШАГ 2 (один запрос): Просим проанализировать провал → получаем тип ошибки + корневую причину
ШАГ 3 (один запрос): Просим создать skill-файл для этого типа ошибок
ШАГ 4 (следующие задачи): Вставляем skill-файл в промпт → точный ответ

🚀

Пример применения

Задача: Ты финансовый директор небольшой компании в Москве. Просишь Claude помочь с оценкой стоимости бизнеса при подготовке к продаже. Модель раз за разом путает метод DCF (дисконтирование денежных потоков) и метод мультипликаторов — и даёт неверные числа.

Промпт — Шаг 1 (анализ провала):

Ты дал неверный ответ при оценке компании. Проанализируй провал:

Мой вопрос: «Оцени стоимость компании с выручкой 50 млн руб./год, 
EBITDA 12 млн руб., стабильным ростом 8% в год. Отрасль — IT-услуги.»

Твой ответ: [вставить неверный ответ]
Правильный ответ/подход: [вставить верный метод или результат]

Выполни анализ строго по структуре:
1. ТИП ОШИБКИ: выбери из списка — неверный метод / концептуальная путаница / 
   пропущенный шаг / неверные вводные / ошибка единиц или валюты
2. КОРНЕВАЯ ПРИЧИНА: не ЧТО было неверно, а ПОЧЕМУ — какого знания не хватило
3. SKILL-ФАЙЛ: напиши по шаблону:
   ## Навык: [название]
   **Область:** [тема задачи]
   **Тип ошибки:** [из классификации выше]
   **Когда применять:** [конкретные триггеры — какие слова/условия в вопросе]
   **Процедура:** [пошаговый алгоритм решения]
   **Разобранный пример:** [миниатюрный кейс с числами]
   **Типичная ловушка:** [что делает модель неверно — и почему это неверно]

Промпт — Шаг 2 (использование skill-файла):

Используй следующий skill-файл для новой задачи оценки бизнеса:

[вставить skill-файл из шага 1]

---
Новая задача: Компания «Рога и Копыта Диджитал», выручка 80 млн руб., 
EBITDA 20 млн руб., рост 5% в год. Нужна оценка для продажи 30% доли 
стратегическому инвестору.

Результат:

На Шаге 1 модель выдаст структурированный анализ: отнесёт ошибку к типу (например, «неверный метод»), объяснит корневую причину (путаница между зрелостью рынка и применимостью DCF), и создаст skill-файл с чётким алгоритмом «когда DCF, когда мультипликаторы, когда комбинация».

На Шаге 2 с вставленным skill-файлом — модель пойдёт по правильному алгоритму с первой попытки: выберет метод, обоснует, посчитает с нужными вводными.


🧠

Почему это работает

LLM хорошо следует явным инструкциям в промпте. Плохо — самостоятельно выбирает между конкурирующими процедурами. При сложных экспертных задачах модель знает много методов, но держит их в одной куче — и достаёт случайный. Это не незнание, это проблема выбора нужного инструмента в нужный момент.

Ключевой рычаг: skill-файл — это не дополнительный контекст, а сужение пространства решений. Вместо «выбери метод из всего что знаешь» — «вот процедура для этого конкретного типа задачи, следуй ей». Модель перестаёт гадать и начинает исполнять алгоритм.

Самообучение работает потому что анализ собственного провала — это задача другого типа, чем сама задача. При решении задачи модель генерирует ответ. При анализе провала — диагностирует паттерн. Это разные режимы, и второй у LLM получается лучше, чем ожидаешь. Авторы показывают: self-teaching (модель сама себя учит) даёт 73% от прироста полной системы с отдельным учителем — это много.

Рычаги управления в ручной версии: - Количество skill-файлов — не пытайся сделать один файл на всё. Один тип ошибки = один файл. Точечность важнее полноты - Детализация «когда применять» — чем конкретнее триггеры (ключевые слова, условия задачи), тем точнее модель выбирает нужный файл - Раздел «типичная ловушка» — добавь явно, что делает модель неверно. Это самая рабочая часть файла - Итерация — если skill-файл после применения снова дал ошибку, попроси LLM обновить файл с учётом нового провала. Два-три раунда — оптимум (авторы показывают: на третьем раунде начинается переобучение)


📋

Шаблон промпта

📌

Шаблон 1: Создание skill-файла из провала

Ты дал неверный ответ. Проанализируй провал и создай skill-файл:

МОЙ ВОПРОС: {вопрос}
ТВОЙ ОТВЕТ: {неверный_ответ}  
ВЕРНЫЙ ОТВЕТ: {правильный_ответ_или_подход}

Анализ по структуре:

1. ТИП ОШИБКИ (выбери один):
   — неверный метод решения
   — концептуальная путаница (смешал понятия)
   — пропущенный шаг в процедуре
   — неверные вводные данные
   — ошибка единиц / формата

2. КОРНЕВАЯ ПРИЧИНА: не что пошло не так, а почему — 
   какого конкретного знания или правила не хватало

3. SKILL-ФАЙЛ:

## Навык: {название_навыка}

**Область:** {тема_предметной_области}
**Тип ошибки:** {тип_из_шага_1}

**Когда применять:**
[Конкретные триггеры — слова в вопросе, условия, 
контекст — когда нужен именно этот навык]

**Процедура:**
Шаг 1: ...
Шаг 2: ...
Шаг 3: ...

**Разобранный пример:**
Вопрос: [миниатюрный кейс]
Решение по шагам: [с числами или конкретикой]
Результат: [правильный ответ]

**Типичная ловушка:**
Что делают неверно: [описание ошибки]
Почему это неверно: [объяснение]
Как правильно: [корректный подход]
🚀

Шаблон 2: Применение skill-файла

Реши задачу, используя skill-файл ниже как руководство:


{вставить_skill_файл}


ЗАДАЧА: {новая_задача_того_же_типа}

Сначала проверь: подходит ли этот skill-файл для данной задачи 
(сопоставь с разделом «Когда применять»). 
Если подходит — следуй процедуре из файла шаг за шагом.

Что подставлять: - {вопрос} — исходное задание, которое дал LLM - {неверный_ответ} — ответ модели, который оказался неверным - {правильный_ответ_или_подход} — верный результат или хотя бы верный метод (можно написать «правильный метод — X, а ты использовал Y») - {название_навыка} — LLM заполнит сам, но можно подсказать: «Оценка бизнеса: выбор метода» - {новая_задача_того_же_типа} — следующий вопрос из той же области


🚀 Быстрый старт — вставь в чат:

Вот шаблон для создания skill-файла из моего провала с LLM. 
Адаптируй под мою ситуацию: {твоя задача и область}.
Задавай вопросы, чтобы заполнить поля.

[вставить шаблон выше]

LLM спросит про конкретный провал (что спросил, что ответила модель, что оказалось верным) — потому что без этого нельзя классифицировать тип ошибки и написать правильные триггеры в «Когда применять». Она возьмёт паттерн из шаблона и создаст готовый skill-файл для твоей предметной области.


⚠️

Ограничения

⚠️ Ручная версия — разовые задачи, не система: ASDA в оригинале работает на сотнях задач автоматически. Вручную ты создаёшь skill-файлы по одному, после каждого провала. Это полезно, но прирост меньше — без автоматизации не получишь систематической библиотеки навыков.

⚠️ Открытые вопросы (free-form) — слабее, чем с вариантами ответа: Skill-файлы сильнее помогают, когда нужно выбрать метод из нескольких — как в тестах с вариантами. При свободных формулировках модель может «переусердствовать» и переосмыслить уже верное рассуждение под влиянием навыка.

⚠️ Два-три раунда — потолок: Итерации улучшают результат до 2-го раунда. На третьем — регрессия. Не пытайся бесконечно уточнять один skill-файл. Лучше создать отдельный файл для нового подтипа ошибки.

⚠️ Нужен верный ответ для обратной связи: Метод работает только если ты знаешь, где LLM ошибся. Для задач без проверяемого правильного ответа (субъективные оценки, творческие тексты) — не применимо.


🔗

Ресурсы

  • Статья: ASDA: Automated Skill Distillation and Adaptation for Financial Reasoning
  • Код и skill-библиотека: https://github.com/SallyTan13/ASDA-skill
  • Авторы: Tik Yu Yim, Wenting Tan, Sum Yee Chan, Tak-Wah Lam, Siu Ming Yiu — The University of Hong Kong
  • Бенчмарк: FAMMA (Financial Amalgamated Multi-Modal Multi-task Assessment) — 1945 финансовых вопросов из учебников и профессиональных экзаменов
  • Стандарт skill-файлов: Agent Skills open standard — Markdown-файлы с метаданными маршрутизации и встроенными шаблонами кода

📋 Дайджест исследования

Ключевая суть

Проблема: LLM проваливает экспертные задачи не потому что не знает методов — она знает пять и берёт не тот. Это проблема выбора, а не знания. Метод ASDA позволяет превращать каждый такой провал в структурированный файл навыка, который вставляется в промпт при похожих задачах. Вместо одного монолитного промпта — модульная библиотека: один тип ошибки = один файл с алгоритмом и чёткими триггерами «когда применять». Модель перестаёт угадывать метод и начинает идти по процедуре. Самостоятельный анализ своих провалов вручную даёт 73% от прироста полной автоматической системы с отдельным «учителем» — и это без дообучения.

Принцип работы

Стандартный путь борьбы с ошибками — дорабатывать системный промпт, добавляя правила. Со временем он раздувается в справочник на 500 строк. Модель тонет в нём и всё равно берёт не тот метод. ASDA переворачивает логику: не «пиши подробнее», а «создай отдельный файл для каждого типа ошибки». Структура файла: «когда применять» (конкретные триггеры из вопроса) + пошаговая процедура + разобранный пример с числами + раздел «типичная ловушка». При новой задаче модель получает только один нужный файл — не всю библиотеку разом. Сужение пространства решений работает лучше, чем расширение инструкций.

Почему работает

LLM хорошо следует явным инструкциям в промпте. Плохо — сама выбирает между конкурирующими процедурами. При сложной задаче в её «голове» одновременно несколько методов, и она достаёт случайный. Файл навыка не напоминает методы — он убирает все кроме одного нужного. Другой механизм: анализировать провал — это другая задача, чем сам расчёт. Когда модель диагностирует паттерн ошибки, она справляется лучше, чем при решении. Именно поэтому самообучение работает — это разные режимы, и диагностический у LLM получается неожиданно хорошо.

Когда применять

Финансовые расчёты, юридический анализ, бухгалтерия, медицинские задачи — любая область с проверяемым ответом и конкурирующими методами. Особенно когда модель делает одну и ту же ошибку раз за разом в одном типе задач — это сигнал: пора создавать файл навыка. НЕ подходит для субъективных оценок и творческих текстов — нет способа проверить правильность, значит, нет обратной связи для создания файла.

Мини-рецепт

1. Поймай провал: дай модели задачу → получи неверный ответ → убедись что знаешь верный (хотя бы на уровне «ты применил метод X, а нужен был Y»).

2. Запроси диагностику: попроси модель классифицировать тип ошибки — неверный метод / путаница в понятиях / пропущенный шаг / неверные вводные. Потом — найти корневую причину: не что пошло не так, а почему.

3. Создай файл навыка: попроси написать по шаблону — область, тип ошибки, «когда применять» с конкретными триггерами из текста задачи, пошаговая процедура, разобранный пример с числами, типичная ловушка.

4. Проверь, потом применяй: перед сохранением — прогони файл на исходном провале: стала ли модель правее? Если да — вставляй в следующую аналогичную задачу. Если снова ошибка — создай отдельный файл для нового подтипа. Не трать больше двух раундов на один файл: авторы показали, что на третьем начинается регрессия.

Примеры

[ПЛОХО] : Помоги оценить стоимость компании для продажи. Выручка 80 млн руб., EBITDA 20 млн руб., рост 5% в год (Модель выберет метод наугад — и с 50% вероятностью возьмёт не тот.)
[ХОРОШО] : Шаг 1 — создаём файл навыка из предыдущего провала: Ты дал неверный ответ при оценке компании. Задача была: выручка 50 млн, EBITDA 12 млн, рост 8%, IT-услуги. Ты использовал метод дисконтирования денежных потоков, а правильный — метод мультипликаторов по отрасли. Выполни анализ: 1) тип ошибки из списка — неверный метод / путаница в понятиях / пропущенный шаг / неверные вводные; 2) корневая причина — почему взял не тот метод; 3) файл навыка по шаблону: область, тип ошибки, когда применять (триггеры), процедура пошагово, пример с числами, типичная ловушка Шаг 2 — применяем: Используй skill-файл ниже для решения задачи. Сначала проверь раздел «когда применять» — подходит ли файл. Если да — иди по процедуре шаг за шагом. [вставить skill-файл из шага 1] ЗАДАЧА: Компания «Рога и Копыта Диджитал», выручка 80 млн руб., EBITDA 20 млн руб., рост 5% в год. Оцени стоимость для продажи 30% доли стратегическому инвестору
Источник: ASDA: Automated Skill Distillation and Adaptation for Financial Reasoning
ArXiv ID: 2603.16112 | Сгенерировано: 2026-03-18 04:26

Проблемы LLM

ПроблемаСутьКак обойти
Модель знает методы, но не выбирает нужныйДаёшь экспертную задачу. Модель знает 3–5 подходов. Но достаёт случайный. Одна и та же задача — разный метод при каждом запросе. Это не незнание. Это сбой выбора. Проявляется везде где есть конкурирующие процедуры: финансы, право, медицина, техникаДай модели явный алгоритм для конкретного типа задачи. Сними выбор с неё. Сделай skill-файл — короткую инструкцию «когда применять + как действовать» — и вставь в промпт

Методы

МетодСуть
Skill-файл из провала — точечная инъекция знанияКогда: Модель повторяет одну и ту же ошибку в схожих задачах. Шаг 1 — анализ: Скажи модели что она ошиблась. Дай вопрос, её неверный ответ, верный подход. Попроси назвать тип ошибки и корневую причину. Шаг 2 — skill-файл: Попроси создать файл по шаблону: Навык / Область / Когда применять / Процедура / Пример / Типичная ловушка. Шаг 3 — применение: Вставляй файл в промпт для следующих задач того же типа через . Модель проверяет по разделу «Когда применять» — подходит ли файл — и следует процедуре. Правила: один тип ошибки = один файл. Не пытайся сделать один файл на всё. Максимум 2 раунда уточнений — потом лучше создать новый файл для подтипа. Работает только если знаешь правильный ответ — без него нельзя найти корневую причину

Тезисы

ТезисКомментарий
Явная процедура в запросе заменяет угадывание методаКогда модели не дают инструкцию — она выбирает метод из всего что знает. Это лотерея. Когда даёшь конкретный алгоритм — она исполняет его. Это разные режимы работы. Первый — генерация. Второй — исполнение. Второй надёжнее. Применяй: вместо «реши задачу» пиши «следуй этой процедуре шаг за шагом: …»
📖 Простыми словами

ASDA: Automated Skill Distillation and Adaptation for Financial Reasoning

arXiv: 2603.16112

Суть метода ASDA в том, что нейросети на самом деле не тупые, они просто неорганизованные. Представь, что у модели в голове огромный склад инструментов, но всё свалено в одну кучу. Когда прилетает сложная задача, она хватает первый попавшийся молоток и пытается забить им шуруп. Проблема не в отсутствии знаний, а в кривом выборе метода. ASDA заставляет модель работать над ошибками: анализировать свои косяки и упаковывать правильные алгоритмы в компактные файлы навыков, которые потом подсовываются ей в нужный момент.

Это как если бы ты учил стажёра варить кофе. Сначала он портит пять чашек, потому что путает помол и температуру. Но вместо того чтобы просто наорать, ты заставляешь его выписать на стикер: «Для эспрессо — мелкий помол, 92 градуса, не перепутай» — и приклеить этот стикер прямо на кофемашину. В следующий раз стажёр не гадает, а просто читает свою же инструкцию. ASDA делает то же самое: превращает горький опыт в четкий мануал, который висит перед глазами у нейронки.

В реальности это работает через три шага: анализ провала, дистилляция навыка и адаптация. Если модель лажает в расчёте стоимости бизнеса, она сама вычисляет, где именно свернула не туда — например, перепутала метод DCF с мультипликаторами. Затем она пишет короткую инструкцию, как их различать, и этот skill file вшивается в промпт. В итоге вместо абстрактных рассуждений модель выдаёт жесткую логику, потому что у неё теперь есть шпаргалка, написанная на её же языке.

Хотя метод тестировали на сложных финансовых задачах, принцип универсален. Это лекарство от любой ситуации, где нейронка «плывёт» в экспертной теме — будь то юридический анализ, написание кода или медицинская диагностика. Везде, где есть риск перепутать похожие, но разные процедуры, структурированные навыки работают лучше, чем просто длинный и нудный промпт. Мы переходим от попыток «научить модель всему» к созданию динамической библиотеки знаний, которую она собирает сама.

Главный вывод: хватит надеяться, что модель «сама догадается» — она не догадается. Нужно внедрять автоматизированную рефлексию. Если твоя нейронка стабильно лажает в одном и том же месте, не меняй модель, а заставь её создать файл навыка. Это превращает хаотичный чат в экспертную систему, которая умнеет с каждой ошибкой. Кто научится дистиллировать такие навыки, тот получит предсказуемый результат там, где остальные будут получать рандомный бред.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с