3,583 papers
arXiv:2601.03791 64 7 янв. 2026 г. PRO

CRM Framework: LLM "угадывают" данные по паттернам, а не запоминают точно

КЛЮЧЕВАЯ СУТЬ
Исследователи из Aalborg University проверили, действительно ли LLM "запоминают" персональные данные (email, телефоны, имена), или просто угадывают их по подсказкам в промпте. Они протестировали 32 языка и обнаружили: большинство "утечек" данных — не настоящее запоминание, а распознавание паттернов. Если в промпте есть имя "Ivan Petrov" и типичный домен, модель может выдать "ivan.petrov@gmail.com" — не потому что видела этот email в обучении, а потому что это стандартный формат.
Адаптировать под запрос

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с