Недавнее исследование под руководством Максима Топаза (Columbia University) и корреспонденция в The Lancet привлекли внимание к резкому росту фальшивых ссылок в биомедицинской литературе — проблема, во многом спровоцированная широким использованием больших языковых моделей (LLM) и индустрией «на заказ» написанных статей.
Ключевые выводы
Масштаб исследования: проверено ≈2,471,758 открытых статей (PubMed Central) и ≈125 млн ссылок.
Рост фальшивых ссылок: с 2023 по начало 2026 года частота фальшивых ссылок на 10 000 статей выросла с ~4 до 56.9 (рост более чем в 12 раз).
Распространённость и бездействие: 98.4% статей с обнаруженными фальшивыми ссылками не получили исправлений или отзыва.
Наиболее уязвимы обзоры (review articles): частота фальшивых ссылок у них на 57% выше, чем у прочих типов статей — особенно опасно, поскольку обзоры формируют основу систематических обзоров и клинических руководств.
Примеры злоупотреблений: в одном онкологическом обзоре из 30 ссылок 18 оказались вымышленными; в ряде журналов отмечались повторяющиеся фальшивые ссылки и «серии» статей с одинаковыми поддельными источниками.
Личный случай: сам Топаз почти оказался обманут — LLM подставил фиктивную ссылку при редактуре комментария, и первый ручной чек этого не выявил.
Команда Топаза разработала многоуровневую автоматизированную систему верификации ссылок: LLM для первичного скрининга + независимая ручная проверка. Точная метрика — точность ≈91%. Главная техническая трудность — минимизировать ложные срабатывания при огромном объёме ссылок (миллионы), чтобы не создать лавину неверных предупреждений.
Причины и специфика проблемы
LLM ускорили и упростили генерацию текста и ссылок, но допускают «галлюцинации» — генерацию правдоподобных, но несуществующих публикаций.
Существуют также коммерческие сервисы по написанию статей и слабые места в редакционнорецензионных процессах журналов.
Фальшивые ссылки чаще не просто опечатки, а полностью вымышленные работы с правдоподобными авторами и датами, что делает традиционную проверку менее надёжной.
Почему это опасно
Разрушение доказательной цепочки: если цитируемые источники не существуют, выводы статей лишаются надёжной опоры.
Риск для клинической практики: обзоры и систематические исследования, основанные на фальшивых или неподтверждённых ссылках, могут попасть в основу клинических руководств и повлиять на решения врачей.
Долговременная «поллютия» корпуса: фальшивые ссылки могут быть процитированы снова и попасть в тренировочные данные новых моделей — порочный круг усиления дезинформации.
Проблема фальшивых ссылок — не частная ошибка, а системный риск для научной экосистемы. AI — инструмент, который ускорил создание контента, но без обязательной верификации он же ускорил загрязнение научных баз.
Самый срочный и практически реализуемый шаг — встраивание автоматической проверки ссылок в процесс подачи статей: это не отменит свободы использования AI, но защитит научную цепочку доказательств и снизит риск нанесения вреда клинике и обществу.
sms_systems@inbox.ru
+ 7 (985) 982-70-55