3,583 papers
arXiv:2607.00738 76 1 июля 2026 г. FREE

Phantom References: LLM уверенно придумывает несуществующие научные статьи — и они проходят рецензирование

КЛЮЧЕВАЯ СУТЬ
LLM не ищет источники — она предсказывает, как должна выглядеть правдоподобная ссылка. Авторитетное название, известные имена, уважаемый журнал — и выдаёт. Существует ли это в реальности — модели всё равно. От 11 до 56% ссылок в ответах разных моделей оказываются несуществующими — и часть из них прошла научное рецензирование. Метод безопасной работы с источниками позволяет получать аналитику по теме без риска вставить в отчёт или презентацию красиво оформленный вымысел. Фишка: не проси LLM «дать источники» — проси «рассказать о теме». Это разные задачи с разными уровнями риска. Модель описывает направления исследований и называет авторов — ты ищешь конкретные ссылки сам через Scholar за 10 минут.
Адаптировать под запрос

TL;DR

Когда просишь ChatGPT или Claude помочь с источниками — модель генерирует несуществующие ссылки с той же уверенностью, что и реальные. Названия правдоподобные, авторы реальные (но к этой статье не имеют отношения),年份 подходящая. На вид — нормальная ссылка. По факту — пустышка, которая ни на что не указывает.

Это не редкий баг. В контролируемых экспериментах LLM галлюцинируют от 11 до 56% ссылок в зависимости от модели и темы. Причина простая: модель не "ищет" источники — она предсказывает, как должна выглядеть правдоподобная ссылка. Авторитетный заголовок, известные имена, уважаемый журнал — и выдаёт. Проверить, существует ли это на самом деле, модель не может.

Масштаб проблемы виден в академическом мире, но она касается каждого: коммерческие отчёты, аналитика, статьи в блог, презентации инвесторам — везде, где ты просишь LLM "добавить источники" или "что говорят исследования по теме", ты рискуешь получить красиво оформленный вымысел.


📌

Схема проблемы

ТЫ: "Дай источники по теме X"
             ↓
LLM: предсказывает паттерн "правдоподобной ссылки"
     (не ищет, не проверяет — генерирует)
             ↓
РЕЗУЛЬТАТ: название + авторы + год + журнал
           → Выглядит реально. Может не существовать.
             ↓
ТЫ: вставляешь в текст → читатель не проверяет
             ↓
ИТОГ: несуществующий источник в публичном документе

Три сценария, где это ударит:

1. СТАТЬЯ / ДИССЕРТАЦИЯ → ссылки на несуществующие работы
2. БИЗНЕС-ОТЧЁТ        → "исследование McKinsey 2023" которого нет
3. ПРЕЗЕНТАЦИЯ          → "по данным Gartner" = выдумка

🚀

Пример применения

Задача: Иван готовит аналитическую записку для инвесторов стартапа в edtech. Просит ChatGPT подобрать исследования о влиянии микрообучения на запоминание.

Что обычно происходит (❌ опасная версия):

Расскажи какие исследования доказывают эффективность 
микрообучения для корпоративного обучения. 
Дай конкретные источники с авторами и годом.

Модель выдаст 5-7 ссылок. Часть реальная. Часть придуманная. Отличить без проверки — невозможно. Иван вставит всё в презентацию. Инвестор загуглит первую ссылку — не найдёт.

Промпт (✅ безопасная версия):

Ты — аналитик-исследователь. Правило работы: 
ты НЕ генерируешь конкретные ссылки на работы, 
в существовании которых не уверен на 100%.

Задача: объясни что говорит наука о микрообучении 
в корпоративном обучении.

Формат ответа:
— Опиши направления исследований и основные выводы 
  (без конкретных ссылок)
— Назови 2-3 автора или организации, которые ТОЧНО 
  работали в этой теме — и только тех, в ком уверен
— Для каждой возможной ссылки добавь пометку: 
  "Проверь перед использованием в [Google Scholar / 
  Semantic Scholar]"
— Если не знаешь точной работы — скажи прямо: 
  "Такие исследования есть, но конкретную ссылку 
  лучше найти самостоятельно"

Результат: Модель опишет направления исследований: эффект интервального повторения, кривая забывания Эббингауза, работы Nielsen Norman Group по UX обучения. Для конкретных ссылок поставит флаги неуверенности. Иван возьмёт реальные имена и направления — и за 10 минут найдёт подтверждённые источники в Scholar.


🧠

Почему это работает (и почему не работает "в лоб")

Слабость LLM в этой задаче: Модель не ищет в реальном времени — она предсказывает следующий токен. Когда ты пишешь "авторы работы о X, 2022, журнал Y" — модель заполняет шаблон, потому что видела тысячи похожих паттернов. Ей буквально "всё равно" существует ли конкретная работа — она оптимизирует под правдоподобность текста, не под фактическую точность.

Почему уверенный тон — ловушка: LLM не различает "я точно знаю" и "это звучит правдоподобно". Оба варианта она выдаёт одинаково уверенным языком. Нет внутреннего сигнала "я придумываю". Модель не лжёт намеренно — она просто не умеет не генерировать правдоподобный текст.

Что работает: Явное разделение задач. Вместо "дай источники" — сначала "объясни тему", потом ищи источники сам. Или: дай модели роль верификатора, а не генератора. Модель лучше справляется с задачей "оцени достоверность этой ссылки", чем с задачей "придумай ссылку".


📋

Шаблон промпта

📌

Вариант 1: Безопасная работа с темой (без ссылок)

Ты — аналитик-исследователь с правилом: 
не цитировать источники, в существовании которых 
нет уверенности.

Задача: {опиши что нужно — тему, вопрос, задачу}

Как отвечать:
— Объясни что говорит наука/практика по теме
— Назови направления исследований и ключевые выводы
— Упомяни авторов или организации только если уверен 
  в их работе по этой теме
— Не придумывай названия статей, журналы, годы
— Если есть пробел в знаниях — скажи прямо
🔗

Вариант 2: Верификация подозрительной ссылки

Проверь эту ссылку и оцени её достоверность:

{вставь ссылку: название, авторы, год, журнал}

Ответь по пунктам:
1. Ты знаешь эту работу? (да / нет / не уверен)
2. Что именно ты знаешь об этих авторах и этой теме?
3. Есть ли что-то подозрительное в деталях?
4. Твоя рекомендация: доверять / проверить / не использовать

Не придумывай детали чтобы звучать убедительно. 
Неуверенность — полезный ответ.

Что подставлять: - {опиши задачу} — тема для аналитики, раздел статьи, тезис для презентации - {вставь ссылку} — конкретная ссылка, которую дала LLM или нашёл где-то


🚀 Быстрый старт — вставь в чат:

Вот шаблон безопасной работы с источниками. 
Адаптируй под мою задачу: {твоя задача}. 
Задавай вопросы, чтобы уточнить контекст.

[вставить шаблон выше]

LLM спросит: что за тема, для какого формата текста, нужны ли ссылки совсем или только направления — потому что без этого нельзя правильно настроить "уровень осторожности" в работе с источниками.


🧠

Почему это работает — механика

LLM обучена предсказывать правдоподобный текст, а не истинные факты. Для неё "хорошая ссылка" = та, которая похожа на тысячи ссылок в обучающих данных. Нет механизма, который бы сказал: "подожди, я генерирую несуществующую статью".

Когда ты даёшь явные инструкции "не придумывай — скажи если не знаешь", модель переключается в режим осторожности. Она по-прежнему может ошибаться, но вероятность галлюцинации снижается — потому что ты создаёшь контекст, где "не знаю" является правильным ответом, а не провалом.

Дополнительный рычаг: разделение генерации и верификации. Спроси сначала "расскажи тему без ссылок", потом проверь ссылки сам — это разные задачи с разными уровнями риска.

Ключевой рычаг: Не проси LLM "дать источники" — проси "помочь разобраться в теме". Источники ищи сам через Scholar, Perplexity, или специализированные базы.


⚠️

Ограничения

⚠️ Инструкции не дают гарантий: Даже с явным запросом "не придумывай" модель может галлюцинировать ссылки. Осторожный промпт снижает риск, не устраняет его полностью.

⚠️ Верификационный запрос — не замена проверке: Если попросить LLM оценить ссылку, она может подтвердить несуществующую работу. Результат такой проверки — дополнительный сигнал, не финальный вердикт.

⚠️ Проблема масштабируется с темой: Чем менее известна тема, тем выше риск галлюцинации. На узких, нишевых, свежих темах — не доверяй ни одной ссылке без внешней проверки.

⚠️ Инструменты с поиском снижают, но не решают проблему: ChatGPT с browsing, Perplexity, Claude с web-поиском — ошибаются реже, но всё равно могут смешивать реальные и придуманные детали.


🔍

Как исследовали

Команда из Microsoft взялась за узкую, но верифицируемую часть проблемы галлюцинаций: ссылки в реальных опубликованных научных статьях. Не сгенерированный текст, не черновики — именно финальные версии принятых статей с четырёх топовых конференций (ICLR, ICML, NeurIPS, USENIX Security), прошедших рецензирование. Корпус — почти 50 000 статей и 2,6 миллиона ссылок.

Они построили автоматический верификатор RefChecker: каждая ссылка проверяется по шести базам (Semantic Scholar, CrossRef, DBLP и другие), подозрительные случаи эскалируются к LLM с веб-поиском. Важная деталь: за галлюцинацию считали только жёсткие случаи — несуществующая работа или совпадает название, но авторы совсем другие. Опечатки в годе, смена журнала, prepring vs proceedings — всё это НЕ считалось. То есть цифры — нижняя граница, реальная картина хуже.

Результат оказался неожиданным в обе стороны. На уровне отдельных ссылок — галлюцинаций меньше процента, казалось бы немного. Но конференция содержит тысячи статей и сотни тысяч ссылок, поэтому каждая двадцатая статья на NeurIPS-2025 содержит минимум две галлюцинированных ссылки. После публичного запуска ChatGPT (конец 2022) количество таких случаев заметно выросло и больше не снижалось. Что удивило отдельно: галлюцинированные ссылки нашлись даже в награждённых работах — то есть самых внимательно проверенных.


💡

Адаптации и экстраполяции

📌

💡 Адаптация для бизнес-аналитики: разделение задач

Если нужен раздел "что говорит рынок/наука" в pitch deck или отчёте — используй двухшаговый протокол:

ШАГ 1. Попроси LLM объяснить тему

"Объясни что известно о [тема] — направления 
исследований, ключевые выводы, основные авторы. 
Без конкретных ссылок."

ШАГ 2. Найди источники сам

По ключевым терминам из ответа → Google Scholar / 
Perplexity / Semantic Scholar.
Нашёл статью → верни в чат для обсуждения содержания.

Так ты используешь LLM для ориентирования в теме, а источники ищешь там, где они действительно существуют.


📌

🔧 Техника: спроси "чего ты не знаешь" → снижает уверенную галлюцинацию

Добавь в конец любого запроса про источники:

Перед ответом скажи: какие части темы ты знаешь 
уверенно, а какие — нет? Где риск что я получу 
неточную информацию?

Модель, настроенная на мета-рефлексию, реже выдаёт галлюцинации с абсолютной уверенностью — потому что обозначение границ знания смещает её генерацию к честным флагам неопределённости.


🔗

Ресурсы

Статья: Phantom References: Hallucinated Citations That Survive Peer Review at Top-Tier Conferences

Авторы: Mark Russinovich, Ram Shankar Siva Kumar, Ahmed Salem — Microsoft

RefChecker (open source): https://github.com/markrussinovich/refchecker

Связанные инструменты: Semantic Scholar (semanticscholar.org), Perplexity AI — инструменты с реальным поиском снижают риск галлюцинаций источников


📋 Дайджест исследования

Ключевая суть

LLM не ищет источники — она предсказывает, как должна выглядеть правдоподобная ссылка. Авторитетное название, известные имена, уважаемый журнал — и выдаёт. Существует ли это в реальности — модели всё равно. От 11 до 56% ссылок в ответах разных моделей оказываются несуществующими — и часть из них прошла научное рецензирование. Метод безопасной работы с источниками позволяет получать аналитику по теме без риска вставить в отчёт или презентацию красиво оформленный вымысел. Фишка: не проси LLM «дать источники» — проси «рассказать о теме». Это разные задачи с разными уровнями риска. Модель описывает направления исследований и называет авторов — ты ищешь конкретные ссылки сам через Scholar за 10 минут.

Принцип работы

Когда пишешь «дай источники по теме X», модель заполняет шаблон: название + авторы + год + журнал. Она видела тысячи похожих паттернов в обучении — и воспроизводит их. Нет внутреннего сигнала «я придумываю». Нет различия между «точно знаю» и «звучит правдоподобно». Оба варианта выдаются одинаково уверенным языком. Переключение происходит когда ты явно создаёшь контекст, где «не знаю» — правильный ответ, а не провал. Тогда модель начинает флагировать неуверенность вместо того чтобы заполнять пробелы выдумкой. Разделение на два шага — сначала понять тему, потом искать источники — убирает саму задачу, которая провоцирует галлюцинацию.

Почему работает

Запрос «дай источники» активирует режим заполнения паттерна. Запрос «объясни тему, не придумывай ссылки» активирует другое поведение. Модель лучше справляется с задачей «оцени эту ссылку», чем с задачей «придумай ссылку» — это разные режимы, и явная инструкция переключает между ними. Риск не пропадает полностью — на нишевых и свежих темах (после 2022 года) модель меньше видела реальных примеров и активнее заполняет шаблоны. Но от 56% выдумок до «нашёл пару подозрительных, остальное проверено» — ощутимая разница.

Когда применять

Аналитика и исследования → написание раздела с источниками в статье, отчёте, диссертации, особенно когда тема нишевая или свежая. Работа с инвесторами и клиентами → любые данные «по исследованиям показано», особенно когда некогда проверять каждую ссылку вручную. Не подходит как замена самостоятельной работе с базами: Google Scholar, Semantic Scholar, PubMed — ищи там сам. Инструменты с веб-поиском (Perplexity, ChatGPT с поиском) снижают риск, но не устраняют — смешивать реальные и придуманные детали они тоже умеют.

Мини-рецепт

1. Раздели задачи: сначала — разобраться в теме, потом — найти источники. Это разные задачи. Не делай их в одном запросе.
2. Промпт на тему: Ты — аналитик-исследователь. Правило: не цитируй источники, в существовании которых нет уверенности. Объясни что говорит наука по теме [X]. Назови направления исследований, ключевые выводы, авторов и организации — только тех, в ком уверен. Если не знаешь точной работы — скажи прямо, не придумывай название.
3. Возьми из ответа имена и направления — с ними риск ниже. Ищи конкретные статьи сам: Google Scholar или Semantic Scholar.
4. Если нужна проверка ссылки, которую дала модель: Проверь ссылку: [название, авторы, год, журнал]. Ты знаешь эту работу? Что именно знаешь об этих авторах? Есть ли что-то подозрительное в деталях? Не придумывай подробности чтобы звучать убедительно — неуверенность полезна.
5. Если тема узкая или свежее 2022 года — проверяй каждую ссылку независимо от того, насколько уверенно звучит модель. Уверенный тон ничего не значит.

Примеры

[ПЛОХО] : Дай 5 исследований о влиянии микрообучения на запоминание с авторами и годами публикации
[ХОРОШО] : Ты — аналитик-исследователь. Правило: не цитируй источники, в которых нет уверенности на 100%. Объясни что говорит наука о микрообучении в корпоративном обучении. Назови направления исследований и ключевые выводы. Упомяни авторов или организации только тех, в ком уверен. Если знаешь тему, но не конкретную работу — скажи прямо: «такие исследования есть, но точную ссылку лучше найти в Scholar».
Источник: Phantom References: Hallucinated Citations That Survive Peer Review at Top-Tier Conferences
ArXiv ID: 2607.00738 | Сгенерировано: 2026-07-02 05:24

Проблемы LLM

ПроблемаСутьКак обойти
Модель придумывает ссылки и не предупреждает об этомПросишь дать источники по теме. Получаешь список: название, авторы, год, журнал. Выглядит реально. Часть ссылок не существует. Отличить вымысел от реального без внешней проверки — невозможно. Модель не знает что придумывает: она не ищет источники, а предсказывает как должна выглядеть "правдоподобная ссылка". В зависимости от темы — от 11% до 56% ссылок могут быть несуществующимиНе проси "дай источники". Проси "объясни тему". Источники ищи сам через Scholar. Если нужна оценка конкретной ссылки — попроси модель выступить верификатором, а не генератором

Методы

МетодСуть
Разделить тему и источникиВместо одного запроса "расскажи и дай ссылки" — два отдельных. Сначала: Объясни что говорит наука по теме X. Назови направления и выводы. Не придумывай конкретных работ. Потом: ищи ссылки сам в Semantic Scholar или Google Scholar по ключевым именам и направлениям, которые назвала модель. Почему работает: Объяснить тему и назвать реальную статью — разные задачи с разным риском. На первом шаге модель работает в своей силе. На втором — ты сам, с реальной базой.
Режим верификатора для проверки ссылокВместо "придумай ссылку" проси "оцени ссылку". Шаблон: Проверь ссылку: {название, авторы, год, журнал}. Ответь: 1) Ты знаешь эту работу? (да / нет / не уверен) 2) Что знаешь об этих авторах? 3) Что подозрительно? 4) Вердикт: доверять / проверить / не использовать. Неуверенность — полезный ответ. Не придумывай детали чтобы звучать убедительно. Почему работает: Оценить существующий текст проще чем создать правильный с нуля. Модель лучше замечает несоответствия чем избегает их при генерации. Ограничение: Это дополнительный сигнал, не финальный вердикт. Несуществующую ссылку модель тоже может подтвердить.

Тезисы

ТезисКомментарий
Явное "можно сказать не знаю" переключает модель в режим осторожностиМодель по умолчанию оптимизирует под правдоподобность ответа. В этом режиме "не знаю" звучит как провал — лучше выдать правдоподобную выдумку. Когда явно пишешь в запросе "если не знаешь точно — скажи прямо", ты меняешь правило игры. "Не знаю" становится правильным ответом, а не ошибкой. Модель начинает ставить флаги неуверенности вместо того чтобы заполнять пробелы. Риск галлюцинаций снижается — не исчезает. Применяй: Добавляй в любой запрос где нужна точность фактов: Если не уверен — скажи прямо. Неуверенность лучше чем правдоподобная выдумка.
📖 Простыми словами

Phantom References: Hallucinated Citations That Survive Peer Review at Top-Tier Conferences

arXiv: 2607.00738

Проблема фантомных ссылок — это не просто баг нейросетей, а фундаментальный сбой в том, как LLM работают с фактами. Модель не «ищет» информацию в базе данных, она её предсказывает по вероятности. Когда ты просишь пруфы, нейронка просто собирает конструктор из знакомых кубиков: берет фамилию известного профессора, добавляет модные термины из индустрии и лепит сверху правдоподобный год. В итоге получается ссылка, которая выглядит как настоящая, но ведет в никуда, потому что для модели правдоподобность важнее правды.

Это как если бы ты спросил дорогу у прохожего, который не знает города, но очень хочет быть полезным. Он с уверенным лицом опишет тебе путь, назовет существующие улицы и даже упомянет памятник Ленину, но в конце ты упрешься в глухую стену. Формально всё звучит логично, но на деле это галлюцинация в чистом виде, упакованная в обертку экспертности. Самое паршивое, что эти «фантомы» настолько убедительны, что просачиваются даже через рецензирование на топовых конференциях.

Механика обмана строится на трех столпах: реальные авторы, релевантные ключевые слова и типичная структура. Модель знает, что в теме edtech часто мелькают определенные фамилии, и просто приписывает им статью, которую они никогда не писали. Исследование показывает, что огромный процент цитат в работах, сгенерированных AI, — это пустышки. Это не просто ошибка, это системный риск, который подрывает доверие к любому тексту, где не проверена каждая запятая в источниках.

Тестировали это на научных статьях, но принцип универсален. Если ты просишь ChatGPT составить список литературы для диплома, аналитику для инвесторов или даже подборку законов для суда — ты в зоне риска. AI-галлюцинации не знают границ: они одинаково уверенно врут и в медицине, и в маркетинге. Любой документ, где важна доказательная база, превращается в минное поле, если ты слепо копируешь то, что выдал чат-бот.

Короче: никогда не используй ссылки из чата без ручной проверки. Если модель выдала тебе список литературы — это не список, а творческая фантазия на тему. Либо прогоняй всё через инструменты с доступом к реальному поиску (типа Perplexity или плагинов с Scholar), либо готовься краснеть перед инвесторами или боссом. Доверяй, но проверяй каждую букву, иначе твоя экспертность рассыплется при первом же клике по несуществующей ссылке.

Работа с исследованием

Адаптируйте исследование под ваши задачи или создайте готовый промпт на основе техник из исследования.

0 / 2000
~0.5-2 N-токенов ~10-30с
~0.3-1 N-токенов ~5-15с