Обучение запоминанию: оптимизация агентов на основе LLM с адаптивной системой памяти
КЛЮЧЕВАЯ СУТЬ
Обнаружено: LLM катастрофически плохо управляют своей памятью в долгих диалогах — они либо «забывают» важное, либо зацикливаются на неважном, теряя до 40% релевантности ответов к 10-му сообщению.
Исследование предлагает концепцию «цикла памяти» — систему из трёх взаимосвязанных процессов (хранение → извлечение → использование), которая позволяет агенту самостоятельно определять, что важно запомнить и как это применить.
Ключевая фишка: память перестаёт быть пассивным хранилищем текста и становится активным процессом, где агент через рефлексию над задачей (task-specific reflection) извлекает только критически важную информацию. Вместо «запомнить всё» — «понять, что важно для этой конкретной цели». В экспериментах агенты с такой памятью решали задачи на 34% точнее и за 28% меньше шагов.