arXiv:2604.16736 81 17 апр. 2026 г. PRO

Двухшаговая генерация (OGC + Format-Cost Separation): как получить длинный документ от LLM, когда разговор уже длинный

КЛЮЧЕВАЯ СУТЬ

Обнаружено: когда разговор занимает половину контекста, модель теряет до 75–80% способности выдавать длинные ответы. Без ошибки. Без предупреждения. Просто пустой экран — и вы думаете, что что-то сломалось. Исследователи назвали это «заглушанием вывода». Метод двухшаговой генерации позволяет получить полный многостраничный документ даже в конце длинной аналитической сессии — без перезапуска чата. Фишка: сначала попросить весь текст без оформления, потом отдельным запросом — добавить форматирование. Форматирование само по себе стоит токенов: разметка JSON добавляет +15% к объёму, HTML — +20%, структурированные отчёты — до +40%. Когда модель пытается написать красиво оформленный документ при уже заполненном контексте, она тратит и без того сжавшийся бюджет на скобки и теги, а не на содержание. Разделение убирает эту нагрузку с первого шага — и экономит 48–72% токенов.

Адаптировать под запрос

Контент доступен только для PRO подписчиков

Чтобы получить доступ к полному содержанию этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

Выберите модель ИИ:

Ваш запрос:

0 / 2000

~0.5-2 N-токенов ~10-30с

~0.3-1 N-токенов ~5-15с

Меню

Двухшаговая генерация (OGC + Format-Cost Separation): как получить длинный документ от LLM, когда разговор уже длинный

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Работа с исследованием

Результат адаптации