3,583 papers
arXiv:2601.12974 74 19 янв. 2026 г. PRO

Knowledge-Action Gap: почему LLM проваливаются в динамических задачах

КЛЮЧЕВАЯ СУТЬ
LLM проваливается в многошаговых диалогах, хотя блестяще решает статические тесты. GPT-4o, Claude, DeepSeek набирают 90-95% на экзаменационных вопросах, но падают до 50% в клинических сценариях из 5-7 шагов. Фишка: проблема не в знаниях — модель помнит факты. Проблема в том, что модель не задаёт критические вопросы (пассивно ждёт данных) и теряет контекст через 3-4 шага — забывает что спросила раньше, не синтезирует информацию в единую картину. Метод Multi-Step State Tracker решает это через явное разбиение задачи на этапы с промежуточной фиксацией состояния — модель выводит резюме после каждого блока, не дрейфует.
Адаптировать под запрос
📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO
📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс
YandexPay • SberPay • СБП • Карты РФ
⚡ Оплатить через Tribute
Telegram Stars • Моментальный доступ
Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с