arXiv:2606.08400 72 7 июня 2026 г. PRO

Дрейф стандартов в длинном чате: как история разговора незаметно ломает оценку LLM

КЛЮЧЕВАЯ СУТЬ

Обнаружено: LLM не держит абстрактный стандарт оценки отдельно от сессии. Она строит шкалу из того, что уже видела — первый объект и пятнадцатый получают оценку по разным меркам, без какого-либо предупреждения. Метод независимых сессий позволяет получать честные сравнимые оценки: запрашиваешь каждый объект в отдельном новом чате с одним и тем же промптом. Свежая сессия сбрасывает накопленный сдвиг — контекстный дрейф исчезает, и балл 7/10 у первого объекта означает то же самое, что 7/10 у пятнадцатого.

Адаптировать под запрос

Контент доступен только для PRO подписчиков

Чтобы получить доступ к полному содержанию этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

📋 Дайджест исследования

Контент доступен только для PRO подписчиков

Чтобы получить доступ к дайджесту этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Контент доступен только для PRO подписчиков

Чтобы получить доступ к концептам этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

📖 Простыми словами

Контент доступен только для PRO подписчиков

Чтобы получить доступ к упрощённому объяснению этого исследования, оформите PRO подписку

💳 Оплатить через Геткурс

YandexPay • SberPay • СБП • Карты РФ

⚡ Оплатить через Tribute

Telegram Stars • Моментальный доступ

Узнать о PRO

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

Выберите модель ИИ:

Ваш запрос:

0 / 2000

~0.5-2 N-токенов ~10-30с

~0.3-1 N-токенов ~5-15с

Меню

Дрейф стандартов в длинном чате: как история разговора незаметно ломает оценку LLM

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Контент доступен только для PRO подписчиков

Работа с исследованием

Результат адаптации