TL;DR
ExpertAgent — образовательная система, которая ведёт динамическую модель студента (student model) — профиль с отслеживанием знаний, прогресса и слабых мест. На основе этого профиля система планирует обучение: подбирает темы, генерирует квизы, рекомендует материалы. Все объяснения привязаны к проверенным учебным материалам через RAG (Retrieval-Augmented Generation) — система ищет релевантные куски из загруженных учебников и документов, затем генерирует ответ на их основе.
Ключевая проблема традиционных AI-помощников в образовании — они не помнят что вы уже изучили, не видят паттернов в ваших ошибках и дают одинаковый контент всем. Это как репетитор, который каждый раз встречает вас как нового человека. Плюс они часто выдают галлюцинации вместо проверенной информации из учебников.
ExpertAgent решает это через bidirectional loop — двусторонний цикл обратной связи. Студент задаёт вопрос или решает задачу → система обновляет student model (записывает что понял, где ошибся) → на основе обновлённого профиля планирует следующий шаг (новая тема или повторение слабого места) → цикл повторяется. Каждое объяснение генерируется с Chain-of-Thought reasoning и ссылками на источники из учебных материалов.
Схема метода
ПОДГОТОВКА (один раз):
- Загрузить учебники/документы → разбить на фрагменты → создать vector database
ОСНОВНОЙ ЦИКЛ (повторяется):
ШАГ 1: Студент → Вопрос/Ответ на квиз
↓
ШАГ 2: RAG → Найти релевантные куски из учебников
↓
ШАГ 3: LLM + CoT → Сгенерировать объяснение с пошаговой логикой + источники
↓
ШАГ 4: Обновить Student Model → Записать прогресс, ошибки, слабые места
↓
ШАГ 5: Dynamic Planning → Подобрать следующую тему/квиз на основе профиля
↓
Повтор цикла
Пример применения
Задача: Вы готовитесь к сессии по микроэкономике. Хотите, чтобы AI не просто отвечал на вопросы, а планировал ваше обучение, видел где вы слабы, и давал проверенную информацию из учебника Мэнкью.
Промпт (упрощённая концепция для чата):
Ты — мой персональный преподаватель по микроэкономике.
ЗАДАЧА:
1. Веди мой learning profile в структуре:
- Изученные темы: [список]
- Сильные стороны: [концепции которые понял хорошо]
- Слабые места: [где ошибаюсь]
- Текущий уровень: [начинающий/средний/продвинутый]
2. Для каждого ответа:
- Объясни пошагово (Chain-of-Thought)
- Укажи откуда информация (глава учебника/источник)
- После ответа обнови мой профиль
3. Планируй следующий шаг:
- Если тема освоена → переходи к следующей
- Если есть ошибки → дай практику на слабое место
- Предлагай quiz для закрепления
УЧЕБНЫЕ МАТЕРИАЛЫ:
[Прикрепить PDF учебника Мэнкью или другие источники]
ТЕКУЩИЙ ЗАПРОС:
Объясни почему кривая спроса имеет отрицательный наклон?
Результат:
Модель даст:
- Пошаговое объяснение с CoT: закон спроса → эффект дохода → эффект замещения
- Ссылку на источник: "Мэнкью, глава 4, стр. 67-69"
- Обновление профиля: "Изучено: закон спроса. Понял хорошо: базовая концепция. Требует повторения: различие эффекта дохода и замещения"
- Планирование: "Следующий шаг: quiz на 5 вопросов по закону спроса. Потом перейдём к эластичности"
Почему это работает
Слабость LLM: Модели не помнят ваш прогресс между сессиями, не видят паттернов в ошибках, часто галлюцинируют факты вместо того чтобы опираться на учебники.
Сильная сторона LLM: Умеют генерировать понятные объяснения, если дать им контекст из проверенных источников. Умеют следовать структурированным инструкциям для отслеживания состояния.
Как метод использует это:
- RAG grounding — каждое объяснение строится на основе фрагментов из учебников, не на вероятностях модели. Это снижает галлюцинации.
- Student model в чате — вы явно просите модель вести ваш профиль в структурированном виде. Модель "помнит" через явные инструкции записывать и использовать профиль.
- Динамическое планирование — вместо вопрос-ответ модель берёт на себя роль преподавателя: анализирует ваш профиль и предлагает следующий шаг.
Рычаги управления промптом:
- Глубина профиля: можете добавить "эмоциональное состояние" или "предпочитаемый стиль обучения" в student model
- Частота обновлений: "обновляй профиль после каждого ответа" vs "обновляй раз в 5 сообщений"
- Стиль планирования: "планируй линейно (тема за темой)" vs "планируй по слабым местам (drill на ошибках)"
- Формат квизов: "5 вопросов с множественным выбором" vs "2 задачи с развёрнутым ответом"
Шаблон промпта
Ты — персональный преподаватель по {предмет}.
ТВОЯ РОЛЬ:
1. Веди мой learning profile:
- Изученные темы: {список тем}
- Сильные стороны: {концепции понятые хорошо}
- Слабые места: {где ошибаюсь}
- Текущий уровень: {начинающий/средний/продвинутый}
2. Для каждого ответа:
- Объясни пошагово (Chain-of-Thought)
- Укажи источник (если используешь загруженные материалы)
- Обнови мой профиль в конце
3. Планируй следующий шаг обучения:
- Если тема освоена → предложи следующую
- Если есть пробелы → дай практику на слабое место
- Периодически давай quiz для закрепления
УЧЕБНЫЕ МАТЕРИАЛЫ:
{прикрепить PDF учебников или документов}
ФОРМАТ ОТВЕТА:
**Объяснение:**
[Пошаговое объяснение с CoT]
**Источник:**
[Откуда информация]
**Обновление профиля:**
- Изучено: [что понял из этого ответа]
- Освоено: [что понял хорошо]
- Требует повторения: [где видны пробелы]
**Следующий шаг:**
[Что делать дальше: новая тема / quiz / практика]
ТЕКУЩИЙ ЗАПРОС:
{твой вопрос или ответ на задачу}
Заполни плейсхолдеры:
{предмет}— область обучения (микроэкономика, программирование Python, английский язык){список тем}— начальный список тем курса (опционально){начинающий/средний/продвинутый}— твой стартовый уровень{твой вопрос}— конкретный вопрос или задача
🚀 Быстрый старт — вставь в чат:
Вот шаблон персонального AI-преподавателя. Адаптируй под мою задачу: [твоя область обучения].
Задавай вопросы, чтобы настроить профиль и начать.
[вставить шаблон выше]
LLM спросит о твоём уровне, целях обучения и стиле (теория vs практика). Она возьмёт структуру student model и начнёт отслеживать прогресс с первого же ответа.
Ограничения
⚠️ Ручное ведение профиля: В обычном чате ChatGPT/Claude модель "забывает" student profile между сессиями или при длинном диалоге. Нужно либо явно копировать профиль в начало новой сессии, либо использовать "Memory" (в ChatGPT) / Projects (в Claude).
⚠️ RAG требует загрузку материалов: Чтобы модель опиралась на учебники, нужно загружать PDF. В ChatGPT/Claude это работает, но каждый раз при новом чате нужно re-upload или держать материалы в Project.
⚠️ Автоматизация планирования слабая: В полноценной системе ExpertAgent планирование автоматическое. В чате модель предложит следующий шаг, но ТЫ должен сказать "давай quiz" или "переходи к следующей теме". Нет proactive push notifications.
⚠️ Нет визуализации Knowledge Map: Система показывает граф связей между темами с цветовой маркировкой (синий = не трогал, жёлтый = учу, зелёный = освоил, красный = слабо). В чате можно попросить нарисовать текстовую схему, но это не интерактивный граф.
Как исследовали
Исследователи построили полноценную веб-систему с интерфейсом, состоящую из трёх модулей:
- Interactive Learning — чат с RAG: студент задаёт вопрос → система ищет релевантные куски из загруженных учебников → LLM генерирует ответ с CoT и ссылками на источники.
- Track My Progress — dashboard с:
- Knowledge Map (граф связей между темами с цветовой маркировкой mastery level)
- Quiz с автоматической проверкой
- Рекомендации для повторения на основе слабых мест
- Document Management — загрузка учебников → разбиение на чанки → создание vector embeddings для RAG.
Провели внутреннее тестирование с волонтёрами по модели User Acceptance Model (4 категории):
- Performance Expectancy (4.33/5) — пользователи считают что система улучшает эффективность обучения
- Effort Expectancy (4.22/5) — система проста в использовании
- Facilitating Conditions (4.22/5) — достаточно поддержки и ресурсов для работы
- Social Influence (2.78/5) — низкий показатель: внешние факторы (рекомендации коллег, поддержка организации) слабо влияют на adoption
Почему эти результаты: Система хорошо работает индивидуально (high performance, low effort), но плохо масштабируется социально (нет viral effect, нет organizational buy-in). Это типично для образовательных AI-систем — они эффективны для мотивированных одиночек, но не становятся частью групповой практики без институциональной поддержки.
Исследование показало что интеграция трёх компонентов (RAG + student model + dynamic planning) даёт синергию: каждый компонент по отдельности известен, но совместная работа создаёт персонализированный learning loop который адаптируется к студенту в реальном времени.
Адаптации и экстраполяции
💡 Адаптация для саморазвития:
Вместо академического курса используйте этот паттерн для личного развития — чтения книг, изучения навыков, карьерного роста.
Пример — чтение нон-фикшн:
Ты — мой reading coach.
ЗАДАЧА:
1. Веди мой reading profile:
- Прочитанные главы: [список]
- Ключевые инсайты: [что запомнил]
- Вопросы для размышления: [что непонятно]
- Action items: [что применить в жизни]
2. После каждой главы:
- Задай 3 вопроса на понимание
- Помоги сформулировать главный takeaway
- Предложи как связать с прошлыми инсайтами
- Обнови профиль
3. Планируй следующее чтение:
- Если глава усвоена → следующая
- Если есть непонятные моменты → дай дополнительные примеры
- Периодически делай recap всей книги
КНИГА:
[Прикрепить PDF или назвать книгу]
ТЕКУЩАЯ ГЛАВА:
Глава 3: "Привычки как процесс, а не результат"
Модель будет вести reading journal, задавать Socratic questions и помогать интегрировать знания из книги в вашу картину мира.
🔧 Техника: Knowledge Map в текстовом виде
В оригинальной системе есть визуальный граф. В чате можно попросить:
После обновления профиля создавай текстовую Knowledge Map в формате:
ТЕМА: Закон спроса
├─ Изучено: ✅ Базовая концепция
├─ Требует повторения: ⚠️ Эффект дохода vs эффект замещения
└─ Связано с:
├─ → Эластичность (следующая тема)
└─ → Кривая предложения (параллельная тема)
Обозначения:
✅ — освоено хорошо
⚠️ — требует повторения
❌ — не понял / много ошибок
⏸️ — ещё не трогал
Это даёт quick visual scan вашего прогресса в текстовом формате.
Ресурсы
Название работы: "ExpertAgent: Enhancing Personalized Education through Dynamic Planning and Retrieval-Augmented Long-Chain Reasoning"
Авторы: Binrong Zhu, Guiran Liu (San Francisco State University), Nina Jiang (Louisiana State University)
Ключевые концепции из работы:
- Retrieval-Augmented Generation (RAG) для grounding в учебных материалах
- Chain-of-Thought (CoT) reasoning для прозрачности объяснений
- Dynamic Student Modeling для tracking прогресса
- Bidirectional teaching-learning feedback loop
