TL;DR
Фреймворк L1-L5 — пятиуровневая модель зрелости AI-агентов, которая показывает эволюцию от простого "переводчика команд" до автономной системы, способной самостоятельно ставить цели. Каждый уровень определяется тремя возможностями: память (как долго помнит), планирование (насколько сложные задачи решает) и использование инструментов (какие действия выполняет).
Главная находка: большинство пользователей застревают на L1-L2, используя ChatGPT/Claude как продвинутый поисковик или переводчик. Но те же модели способны работать на L3 — самостоятельно вести проект от идеи до результата, если правильно структурировать взаимодействие. Проблема не в технологиях (они есть), а в понимании какой уровень задачи вы решаете и какие возможности нужно "включить".
Фреймворк работает как диагностический инструмент: определите текущий уровень вашей задачи → поймёте, чего не хватает (памяти? планирования? инструментов?) → найдёте техники для перехода на следующий уровень. Например, переход с L1 на L2 требует добавить feedback loop (ReAct), а с L2 на L3 — рефлексию (Reflexion) и структурированную память.
Схема фреймворка
5 уровней зрелости агентов:
L1: PROCESS EXECUTION (исполнитель процессов)
└─ Задача: Перевод инструкций в код/действия
└─ Память: Контекст одной сессии
└─ Планирование: Линейное (шаг за шагом)
└─ Инструменты: Встроенные (калькулятор, кодген)
L2: INTERACTIVE PROBLEM-SOLVING (интерактивный помощник)
└─ Задача: Консультация + поиск решений
└─ Память: Внешние базы знаний (RAG)
└─ Планирование: Реактивное (с обратной связью)
└─ Инструменты: API, браузер, базы данных
L3: END-TO-END AUTONOMOUS (автономная система)
└─ Задача: Полный цикл от идеи до результата
└─ Память: Накопление опыта + рефлексия
└─ Планирование: Древовидное (с перебором вариантов)
└─ Инструменты: Создание новых инструментов
L4: COLLABORATIVE INTELLIGENT (коллективная система)
└─ Задача: Сложные бизнес-процессы командой
└─ Память: Общая база знаний команды
└─ Планирование: Распределённое (кто что делает)
└─ Инструменты: Оркестрация действий группы
L5: ADAPTIVE SOCIAL (адаптивная социальная система)
└─ Задача: Автономная постановка целей
└─ Память: Культурная (накопление ценностей)
└─ Планирование: Генеративное (создание новых целей)
└─ Инструменты: Изменение окружения
Пример применения
⚠️ Ограничение: Фреймворк — это диагностический инструмент, не готовая техника. Он помогает понять ГДЕ вы находитесь и КУДА двигаться, но конкретные техники для каждого уровня — отдельные методы (CoT, ReAct, Reflexion и т.д.).
Задача: Вы маркетолог, хотите запустить email-рассылку для новой услуги вашей компании — консалтинг по автоматизации процессов.
Промпт для диагностики уровня:
Моя задача: создать email-рассылку для услуги "Консалтинг по автоматизации".
Проанализируй эту задачу через фреймворк L1-L5:
1. Какой МИНИМАЛЬНЫЙ уровень нужен? (L1-L5)
2. Какой уровень дал бы МАКСИМАЛЬНЫЙ результат?
3. Что мне не хватает для перехода на следующий уровень?
4. Дай конкретные техники для каждого уровня
Фреймворк:
- L1 (исполнитель): память = сессия, план = линейный, инструменты = встроенные
- L2 (помощник): память = база знаний, план = с feedback, инструменты = API
- L3 (автономный): память = опыт, план = древовидный, инструменты = создание новых
- L4 (команда): память = общая, план = распределённый, инструменты = оркестрация
- L5 (социальный): память = культура, план = новые цели, инструменты = изменение среды
Отвечай структурированно, с примерами для МОЕЙ задачи.
Результат:
Модель объяснит:
- L1 подход: "Напиши мне 3 варианта письма" (разовое поколение текста)
- L2 подход: "Найди примеры успешных рассылок + дай структуру" (поиск + адаптация)
- L3 подход: "Веди весь проект: исследуй аудиторию → создай сегменты → напиши серию писем → протестируй → оптимизируй на основе метрик" (цикл с рефлексией)
- L4 подход: "Команда агентов: один изучает конкурентов, второй пишет тексты, третий A/B-тестит" (мультиагентная система)
Вы увидите разрыв между вашим текущим использованием (скорее всего L1) и потенциалом L3, плюс конкретные техники для перехода.
Почему это работает
Слабость LLM: Пользователи не понимают, что одна и та же модель может работать на разных уровнях сложности. GPT-4 или Claude могут быть и калькулятором (L1), и автономным исследователем (L3) — разница в том, как вы структурируете взаимодействие.
Сильная сторона LLM: Модели универсальны. Они могут имитировать память через явные инструкции ("сохрани это в блокнот"), планирование через промпты ("составь план из 5 шагов, после каждого спрашивай обратную связь"), использование инструментов через интеграции.
Как фреймворк помогает:
- Диагностика: Определяете разрыв между тем, как используете AI сейчас, и как могли бы.
- Roadmap: Фреймворк показывает последовательность: нельзя прыгнуть с L1 на L3, нужно пройти L2. Например, чтобы делегировать AI автономный проект (L3), сначала научитесь работать с ним в режиме "вопрос-ответ с инструментами" (L2).
- Конкретизация потребностей: Вместо абстрактного "хочу, чтобы AI сделал всё сам" вы формулируете: "мне нужна рефлексия (способность анализировать свои ошибки) и древовидное планирование (перебор вариантов)". Это приводит к конкретным техникам: Reflexion, Tree-of-Thought.
Рычаги управления:
- Память: Явно просите модель вести "журнал решений" между сессиями → имитация долгосрочной памяти
- Планирование: Требуйте не один вариант, а дерево из 3-5 путей с оценкой каждого → имитация ToT
- Инструменты: Интегрируйте API (поиск, базы данных) → переход с L1 на L2
Шаблон для диагностики задачи
Моя задача: {описание задачи}
Контекст:
- Сейчас я работаю с AI так: {как именно используете}
- Хочу достичь: {желаемый результат}
- Ограничения: {бюджет, время, технические возможности}
Проанализируй через фреймворк L1-L5:
1. ТЕКУЩИЙ УРОВЕНЬ:
- На каком уровне я сейчас? (L1-L5)
- Почему именно этот?
- Что работает, что нет?
2. ЦЕЛЕВОЙ УРОВЕНЬ:
- Какой уровень нужен для моей задачи?
- Что изменится в результате?
- Какие риски/сложности?
3. РАЗРЫВ:
- Память: что не хватает? (контекст → база знаний → опыт → общая → культура)
- Планирование: где слабое место? (линейное → реактивное → древовидное → распределённое → генеративное)
- Инструменты: чего нет? (встроенные → API → создание → оркестрация → изменение среды)
4. ПЛАН ПЕРЕХОДА:
- Какие техники применить для перехода на следующий уровень?
- Что попробовать СЕГОДНЯ? (один шаг, не весь путь)
- Какие инструменты/интеграции подключить?
Отвечай конкретно, с примерами для МОЕЙ задачи. Не теоретизируй.
Пояснение плейсхолдеров:
{описание задачи}— ваша реальная задача, будь то бизнес-проект, учёба, креатив{как именно используете}— честно: "пишу промпт → получаю ответ → всё" или "делаю 2-3 итерации"{желаемый результат}— что хотите получить на выходе{бюджет, время, технические возможности}— реальные ограничения (есть ли API, сколько времени)
🚀 Быстрый старт — вставь в чат:
Я хочу научиться использовать тебя на более высоком уровне.
Вот задача, которую решаю: [опиши задачу].
Сейчас я просто пишу промпт и получаю ответ (наверное, это L1).
Проведи диагностику: на каком уровне L1-L5 моя задача?
Что мне нужно изменить в работе с тобой, чтобы получить лучший результат?
Дай 1-2 конкретных шага, которые я могу сделать прямо сейчас.
[вставить шаблон выше]
Модель спросит о вашей задаче и текущем подходе, затем предложит конкретные улучшения.
Ограничения
⚠️ Это карта, не территория: Фреймворк показывает ЧТО возможно, но не КАК именно это сделать. Для каждого перехода (L1→L2, L2→L3) нужны конкретные техники, которые описаны в других исследованиях (ReAct, Reflexion, ToT).
⚠️ Не все задачи требуют L3+: Если нужно перевести текст или найти факт — L1 достаточно. Не усложняйте без необходимости. Фреймворк помогает понять, КОГДА усложнение оправдано.
⚠️ Технические барьеры L3+: Полноценный L3 (автономная система с циклами рефлексии) в обычном чате ограничен. Модель "забывает" между сессиями, нет нативной долгосрочной памяти. Обходы: явное ведение журнала, интеграции с внешними инструментами (что требует кода).
⚠️ L4-L5 — пока теория: Мультиагентные системы (L4) и автономная постановка целей (L5) — это исследовательские концепции. В чатах можно имитировать через ролевые игры, но это не полноценная реализация.
Как исследовали
Это обзорная работа (survey), не экспериментальное исследование. Авторы из Харбинского политехнического института и Huawei проанализировали сотни статей по LLM-агентам за последние годы и построили единую систематизацию.
Методология обзора:
- Выделили три технологических столпа (память, планирование, инструменты) как основу любого агента
- Проследили эволюцию каждого столпа от простых форм к сложным
- Связали технологическую эволюцию с уровнями практического применения (L1-L5)
Почему пришли к 5 уровням? Анализируя реальные кейсы применения AI в индустрии, авторы заметили паттерн: разные задачи требуют разных комбинаций памяти, планирования и инструментов. Простая классификация "слабый AI vs сильный AI" не объясняла, почему один проект успешен, а другой нет. Фреймворк L1-L5 возник как способ структурировать это разнообразие.
Что удивило: Оказалось, что большинство "неудачных" внедрений AI — это не проблема технологий, а misalignment между уровнем задачи и уровнем подготовки агента. Компании пытаются использовать L1-инструменты для L3-задач, или наоборот, строят L4-системы там, где хватило бы L2.
Инсайт для практики: Если ваш проект с AI не работает, спросите себя не "плох ли AI", а "правильно ли я оценил уровень задачи и выбрал соответствующие техники?"
Ресурсы
Empowering Real-World Adoption: A Survey on the Technology, Practice, and Evaluation of LLM-driven Industry Agents — Yihong Tang, Kehai Chen и коллеги (Harbin Institute of Technology + Huawei Technologies), 2025
Статья систематизирует 200+ работ по LLM-агентам, охватывая техники от Chain-of-Thought до автономных исследовательских систем.
