3,583 papers
arXiv:2605.23497 75 22 мая 2026 г. FREE

Temporal Grounding: LLM применяет не ту версию правил — почему и как исправить

КЛЮЧЕВАЯ СУТЬ
Парадокс: включить веб-поиск при вопросах об исторических правилах — значит усугубить проблему, а не решить её. Спрашиваешь LLM про закон 2021 года — она отвечает по редакции 2024-го. Это не случайный сбой: новые версии документов при обучении встречались намного чаще — их переиздавали, цитировали, обсуждали. Метод разграничения по времени (Temporal Grounding) позволяет получить точный ответ про любой исторический период. Фишка: вставь нужную редакцию документа прямо в промпт и запрети модели опираться на «память» — она перестаёт угадывать и работает строго по тексту.
Адаптировать под запрос

TL;DR

Когда спрашиваешь LLM о чём-то, что менялось со временем — законах, налогах, требованиях, стандартах — модель часто применяет не ту версию. Либо устаревшую (правила изменились после даты обучения, но модель этого не знает), либо слишком новую (спрашиваешь о 2019 году, а модель применяет нормы 2024-го). Это не случайные ошибки — это два системных сбоя: сталость и смещение к новизне.

Причина — в том, как模ель обучена. Она видела тысячи текстов о правилах, но свежие версии встречались чаще: их больше переиздавали, цитировали, обсуждали. Модель их и запомнила лучше. Когда ты спрашиваешь про 2021 год, она всё равно "тянется" к тому, что знает лучше всего — к последней редакции.

Самое контринтуитивное: включить веб-поиск не поможет, а для исторических вопросов — навредит. Поисковик находит самые свежие документы, что усиливает смещение к новизне. Надёжно работает только одно: явно указать дату события и вставить нужный текст правила прямо в промпт.


🔬

Схема метода

Это исследование-находка. Практический вывод — одношаговая техника, всё в одном промпте:

Шаг 1: Укажи дату события → "Дата: [число, месяц, год]"
Шаг 2: Вставь текст правила → [скопируй нужную редакцию]
Шаг 3: Запрети другие источники → "Отвечай только по тексту выше"
Шаг 4: Задай вопрос

🚀

Пример применения

Задача: Владелец ИП выясняет, можно ли было в 2022 году учесть определённые расходы при расчёте налога по УСН "Доходы минус расходы" — правила с тех пор менялись

Промпт:

Дата события: 10 октября 2022 года.

Используй ТОЛЬКО следующий текст — статья 346.16 НК РФ 
в редакции, действовавшей на октябрь 2022 года:

---
[вставить скопированный текст статьи из КонсультантПлюс 
или Гарант в редакции на нужную дату]
---

Не опирайся на другие источники и свои знания об этой статье — 
они могут отражать текущую редакцию, а не редакцию 2022 года.

Вопрос: можно ли было учесть расходы на покупку 
программного обеспечения при расчёте налога?

Результат:

Модель ответит строго по вставленному тексту. Без вставки — с большой вероятностью применит текущую редакцию. Разница существенная: перечни расходов, лимиты и ставки меняются каждые 1-2 года. Ответ будет чётким: "да, можно" или "нет, такого пункта в редакции 2022 года не было" — с отсылкой к конкретному пункту вставленного текста.


🧠

Почему это работает

Слабость LLM — модель не хранит "историю версий" в голове. В её обучающих данных новые редакции документов встречались чаще старых: их переиздавали, цитировали, обсуждали. Поэтому когда ты спрашиваешь про прошлое, модель "вспоминает" то, что видела чаще — последнюю версию. Явное указание даты в промпте помогает слабо: модель читает подсказку, но "переключиться" не успевает.

Что модель умеет хорошо — рассуждать по тексту, который ты дал прямо в промпте. Если текст есть рядом, модель работает с ним, а не копается в памяти. Это надёжнее, чем полагаться на то, что "она должна знать".

Как исправить — вставить нужный текст вручную. Это ручная версия RAG (Retrieval-Augmented Generation — подход, при котором нужную информацию находят и вставляют в контекст модели). Ты сам находишь правильную редакцию документа на КонсультантПлюс, Гаранте или другом источнике — и передаёшь модели. Она работает по нему, игнорируя "память".

Рычаги управления: - Дата события — указывай всегда, даже если кажется очевидным - Запрет на другие источники — фраза "отвечай только по тексту выше" заметно повышает точность - Версия документа — уточни источник: "редакция, действовавшая на [дату]" - Веб-поиск в AI-инструментах — отключай для исторических вопросов: мешает, а не помогает


📋

Шаблон промпта

Дата события: {дата_события}.

Используй ТОЛЬКО следующий текст — {название_документа} 
в редакции, действовавшей на {дата_версии}:

---
{текст_правила}
---

Не опирайся на другие источники и свои знания об этом документе — 
они могут отражать другую редакцию.

Вопрос: {вопрос}

Плейсхолдеры: - {дата_события} — когда произошла ситуация: "15 марта 2021 года" - {название_документа} — ст. 346.16 НК РФ, п. 3 ФСБУ 6/2020, Приказ № 157н - {дата_версии} — версия, действовавшая на дату события - {текст_правила} — скопированный фрагмент из КонсультантПлюс, Гарант, официального сайта - {вопрос} — твой конкретный вопрос

🚀 Быстрый старт — вставь в чат:

Вот шаблон для вопросов о правилах, которые 
менялись со временем. Адаптируй под мою задачу: {твоя задача}. 
Задавай уточняющие вопросы.

[вставить шаблон выше]

LLM спросит дату события и попросит вставить текст нужной версии правила — потому что без этого модель использует то, что "помнит", а это может быть неправильная редакция.


⚠️

Ограничения

⚠️ Нужен правильный источник: Метод работает только если ты нашёл и вставил нужную версию документа. Поиск нужной редакции — на тебе. КонсультантПлюс и Гарант позволяют смотреть исторические версии, но не всегда бесплатно.

⚠️ Без текста — слабо помогает: Просто указать дату в промпте недостаточно. Модели этого мало, чтобы "переключиться" на историческую редакцию. Нужен сам текст.

⚠️ Веб-поиск в AI-инструментах: ChatGPT с поиском, Perplexity, Copilot — для исторических вопросов эти инструменты скорее навредят. Поисковик находит свежие версии документов и усиливает смещение к новизне. Отключай поиск для вопросов о прошлых периодах.

⚠️ Сложные случаи с несколькими нормами: Если правильный ответ требует нескольких статей разных документов, причём каждая в своей редакции — вставлять нужно все. Иначе одна "устаревшая" норма перекроет правильные.


🔍

Как исследовали

Команда из Мюнхенского технического университета создала 312 юридических вопросов по немецкому законодательству — намеренно с подвохом. Часть требовала знания правил, изменившихся после даты обучения моделей (ChatGPT 5.1 и Claude Sonnet 3.7). Другая часть — наоборот: нужно было применить старую редакцию закона к прошлой ситуации, хотя более современная версия модели тоже знала. Всё это охватывало шесть разных отраслей немецкого права — чтобы не попасть на "хрестоматийные" случаи, которые наверняка есть в обучающих данных.

Отбор был жёстким: юристы отклонили больше половины из 697 сгенерированных вопросов. Главные причины — изменения оказывались редакционными, а не содержательными, или правильный ответ совпадал в обеих редакциях. До финала дошли только 312 пар, где версия закона реально меняла ответ.

Самый неожиданный результат: веб-поиск улучшил ответы на вопросы о новых правилах, но для исторических — заметно ухудшил. Поисковик находил самые свежие версии законов, и модели "перебивали" правильный исторический ответ текущей нормой. RAG с явной фильтрацией по дате ("давать только документы, действовавшие на эту дату") сработал лучше всего в обоих случаях. Вывод: дата должна быть жёстким ограничением, а не подсказкой.


💡

Адаптации и экстраполяции

Принцип работает в любой области, где правила, стандарты или требования менялись со временем:

🔧 Бухучёт и налоги: При расчётах за прошлые периоды — вставляй ставки и статьи из редакции НК РФ, действовавшей тогда. Лимиты, ставки, перечни расходов меняются ежегодно.

🔧 Медицинские протоколы и клинические рекомендации: Стандарты лечения обновляются. Разбор случая из 2020 года — применяй протоколы 2020-го, не 2024-го.

🔧 IT-документация: При разборе кода на старой версии библиотеки или фреймворка — вставляй документацию именно той версии. Модель часто знает только текущий API.

🔧 HR и трудовые споры: Условия нормативных актов, например по расчёту отпускных или компенсаций, менялись. Вставляй редакцию ТК РФ, действовавшую на дату события.

Страховочный вопрос — если нет возможности найти и вставить текст, добавь в конец промпта:

Прежде чем ответить: какую редакцию этого документа ты используешь? 
Если не уверен что у тебя актуальная информация 
на {дата_события} — скажи об этом прямо.

Полностью проблему не решает, но помогает заметить когда модель "плывёт" и применяет не ту версию.


🔗

Ресурсы

Работа: "Asking For An Old Friend: Diagnosing and Mitigating Temporal Failure Modes in LLM-based Statutory Question Answering"

Датасет: github.com/TUMLegalTech/temporal_bias

Авторы: Max Prior, Andreas Schultz, Matthias Grabmair — Technical University of Munich (TUM), Германия

Конференция: ICAIL 2026, июнь 2026, Сингапур


📋 Дайджест исследования

Ключевая суть

Парадокс: включить веб-поиск при вопросах об исторических правилах — значит усугубить проблему, а не решить её. Спрашиваешь LLM про закон 2021 года — она отвечает по редакции 2024-го. Это не случайный сбой: новые версии документов при обучении встречались намного чаще — их переиздавали, цитировали, обсуждали. Метод разграничения по времени (Temporal Grounding) позволяет получить точный ответ про любой исторический период. Фишка: вставь нужную редакцию документа прямо в промпт и запрети модели опираться на «память» — она перестаёт угадывать и работает строго по тексту.

Принцип работы

У модели нет «истории версий» в голове. Она видела тысячи документов при обучении — но свежие редакции встречались чаще и лучше запомнились. Просишь про 2019-й — она тянется к тому, что знает лучше всего: к последней редакции. Просто указать дату в промпте не хватает — нужен сам текст рядом. Когда нужная редакция вставлена в контекст, задача меняется: не «вспомни правила 2021 года», а «прочитай вот этот текст и ответь». Второе модель делает надёжно. Первое — плывёт.

Почему работает

Модель хорошо рассуждает по тексту, который видит прямо сейчас. Плохо — по тексту, который «должна помнить». Это два разных режима работы. Когда нужная редакция вставлена в промпт — модель читает и рассуждает по ней, а не копается в памяти, где лежит не та версия. Веб-поиск усиливает смещение: поисковик находит самые свежие документы — те же, которых и так больше в памяти модели. Для исторических вопросов это двойной удар не в ту сторону. Запрет на другие источники («отвечай только по тексту выше») убирает риск, что модель добавит что-то из памяти поверх нужной редакции.

Когда применять

Налоги и бухучёт → вопросы об исторических периодах: УСН, НДС, страховые взносы за прошлые годы. Трудовые споры → когда важна норма, действовавшая на дату события. Нормативные требования → строительные нормы, санитарные правила, технические регламенты, которые менялись. Юридический анализ прошлых сделок → какие правила действовали на момент подписания договора. НЕ подходит для поиска самой свежей редакции — здесь веб-поиск как раз уместен. НЕ подходит если нет доступа к архивным версиям документов: без правильной редакции на руках метод не работает.

Мини-рецепт

1. Найди нужную редакцию: открой КонсультантПлюс или Гарант, найди документ в версии на нужную дату. Скопируй нужный фрагмент.
2. Укажи дату события: Дата события: [число, месяц, год] — конкретно, не «примерно в 2021 году».
3. Вставь текст правила: Используй ТОЛЬКО следующий текст — [название документа] в редакции, действовавшей на [дата]: [вставить скопированный фрагмент].
4. Запрети «память»: Не опирайся на другие источники и свои знания об этом документе — они могут отражать другую редакцию.
5. Задай вопрос: после всего этого — конкретный вопрос по ситуации.
6. Если используешь ChatGPT с поиском, Perplexity или Copilot — отключи веб-поиск. Для исторических вопросов он найдёт свежие версии и собьёт модель.

Примеры

[ПЛОХО] : Мог ли ИП в 2022 году учесть расходы на покупку программного обеспечения при расчёте налога по УСН «Доходы минус расходы»? — модель ответит по текущей редакции статьи 346.16 НК РФ. Перечень расходов с тех пор менялся — ответ может быть неверным.
[ХОРОШО] : Дата события: октябрь 2022 года. Используй ТОЛЬКО следующий текст — статья 346.16 НК РФ в редакции, действовавшей на октябрь 2022 года: [вставить скопированный текст из КонсультантПлюс] Не опирайся на другие источники и свои знания об этой статье — они могут отражать текущую редакцию, а не редакцию 2022 года. Вопрос: можно ли было учесть расходы на покупку программного обеспечения при расчёте налога? — ответ строго по вставленному тексту с указанием конкретного подпункта. Разница принципиальная: «да, подпункт 19 прямо разрешал» или «нет, такого пункта в редакции 2022 года не было».
Источник: Asking For An Old Friend: Diagnosing and Mitigating Temporal Failure Modes in LLM-based Statutory Question Answering
ArXiv ID: 2605.23497 | Сгенерировано: 2026-05-25 06:26

Проблемы LLM

ПроблемаСутьКак обойти
Модель применяет не ту версию документаСпрашиваешь о правилах 2021 года — получаешь ответ по редакции 2024-го. Или наоборот: нормы изменились после даты обучения, а модель этого не знает. Это не случайная ошибка. Новые версии документов чаще цитировали и переиздавали. Модель их видела больше и запомнила лучше. Поэтому "тянется" к свежей редакции — даже когда ты спрашиваешь про прошлоеВставь нужный текст прямо в промпт. Добавь: "отвечай только по тексту выше". Указание даты в промпте — почти не помогает: модели этого мало чтобы переключиться на историческую версию

Методы

МетодСуть
Вставить текст нужной версии — обойти память моделиНайди нужную редакцию документа (КонсультантПлюс, Гарант, официальный сайт). Скопируй её прямо в промпт. Добавь запрет: Отвечай только по тексту выше. Не используй свои знания об этом документе — они могут отражать другую редакцию. Шаблон: Дата события: {дата}. Используй ТОЛЬКО следующий текст — {документ} в редакции на {дата}: --- {текст} ---. Вопрос: {вопрос}. Почему работает: модель хорошо рассуждает по тексту который видит рядом. Когда текст есть — не лезет в память. Когда применять: любые нормы, правила, стандарты, требования — всё что меняется со временем. Не работает без текста: просто написать дату — недостаточно
📖 Простыми словами

Asking For An Old Friend: Diagnosing and Mitigating Temporal Failure Modes inLLM-based Statutory Question Answering

arXiv: 2605.23497

Проблема в том, что нейросети живут в «вечном сейчас» и совершенно не умеют работать с хронологией. Когда ты спрашиваешь модель о законах или налогах, она не лезет в архив, а выдает усредненную кашу из того, что видела чаще всего. В итоге возникают два системных бага: устаревание (модель не знает о свежих правках) и смещение к новизне (ты спрашиваешь про 2019 год, а она лечит тебя нормами 2024-го). Для LLM время — это не шкала, а просто набор текстов, где новые версии документов тупо перевешивают старые по количеству упоминаний.

Это как если бы ты пришел к юристу, который помнит все законы мира, но у него в голове они свалены в одну кучу без дат. Ты спрашиваешь: "Можно ли было так делать пять лет назад?", а он отвечает, исходя из того, что прочитал в утренней газете. Формально он эксперт, но на деле — опасный дезинформатор, потому что его мозг автоматически подставляет самую свежую информацию туда, где нужны старые правила. Модель просто «забывает» переключить контекст на прошлое, даже если ты явно указал дату в вопросе.

Исследователи нашли решение, которое назвали диагностикой временных сбоев. Суть проста: вместо того чтобы просто задать вопрос, нужно заставить модель сначала явно выписать дату события и дату отсечки своих знаний. Когда LLM проговаривает: "Событие было в 2022-м, а я обучалась на данных до 2023-го", у нее в «сознании» происходит щелчок. Это заставляет нейронку перестать галлюцинировать актуальными нормами и начать искать в своей памяти именно те паттерны, которые соответствуют нужному периоду.

Этот метод — не просто фишка для юристов, а универсальный паттерн для любой работы с меняющимися данными. Тестировали на законах, но это жизненно важно для бухгалтерии, медицины, технической документации и даже SEO-аналитики. Везде, где правила игры меняются раз в год, обычный промпт будет лажать. Принцип явной фиксации времени превращает модель из самоуверенного дилетанта в адекватного архивариуса, который понимает разницу между «было» и «стало».

Короче, забудь про простые вопросы в духе "какие сейчас правила". Если хочешь получить адекватный ответ от AI, заставь его сначала синхронизировать часы. Без четкой привязки к таймлайну ты получишь либо протухшую инфу, либо советы из будущего, которые в твоей ситуации — полный провал. Кто научит свои промпты «чувствовать время», тот перестанет ловить нелепые ошибки на ровном месте.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с