Кризис фальшивых ссылок в биомедицинской науке

Строева Марина
Социальные сети

Недавнее исследование под руководством Максима Топаза (Columbia University) и корреспонденция в The Lancet привлекли внимание к резкому росту фальшивых ссылок в биомедицинской литературе — проблема, во многом спровоцированная широким использованием больших языковых моделей (LLM) и индустрией «на заказ» написанных статей.

Ключевые выводы

Масштаб исследования: проверено ≈2,471,758 открытых статей (PubMed Central) и ≈125 млн ссылок.

Рост фальшивых ссылок: с 2023 по начало 2026 года частота фальшивых ссылок на 10 000 статей выросла с ~4 до 56.9 (рост более чем в 12 раз).

Распространённость и бездействие: 98.4% статей с обнаруженными фальшивыми ссылками не получили исправлений или отзыва.

Наиболее уязвимы обзоры (review articles): частота фальшивых ссылок у них на 57% выше, чем у прочих типов статей — особенно опасно, поскольку обзоры формируют основу систематических обзоров и клинических руководств.

Примеры злоупотреблений: в одном онкологическом обзоре из 30 ссылок 18 оказались вымышленными; в ряде журналов отмечались повторяющиеся фальшивые ссылки и «серии» статей с одинаковыми поддельными источниками.

Личный случай: сам Топаз почти оказался обманут — LLM подставил фиктивную ссылку при редактуре комментария, и первый ручной чек этого не выявил.

Команда Топаза разработала многоуровневую автоматизированную систему верификации ссылок: LLM для первичного скрининга + независимая ручная проверка. Точная метрика — точность ≈91%. Главная техническая трудность — минимизировать ложные срабатывания при огромном объёме ссылок (миллионы), чтобы не создать лавину неверных предупреждений.

Причины и специфика проблемы

LLM ускорили и упростили генерацию текста и ссылок, но допускают «галлюцинации» — генерацию правдоподобных, но несуществующих публикаций.

Существуют также коммерческие сервисы по написанию статей и слабые места в редакционнорецензионных процессах журналов.

Фальшивые ссылки чаще не просто опечатки, а полностью вымышленные работы с правдоподобными авторами и датами, что делает традиционную проверку менее надёжной.

Почему это опасно

Разрушение доказательной цепочки: если цитируемые источники не существуют, выводы статей лишаются надёжной опоры.

Риск для клинической практики: обзоры и систематические исследования, основанные на фальшивых или неподтверждённых ссылках, могут попасть в основу клинических руководств и повлиять на решения врачей.

Долговременная «поллютия» корпуса: фальшивые ссылки могут быть процитированы снова и попасть в тренировочные данные новых моделей — порочный круг усиления дезинформации.

Проблема фальшивых ссылок — не частная ошибка, а системный риск для научной экосистемы. AI — инструмент, который ускорил создание контента, но без обязательной верификации он же ускорил загрязнение научных баз.

Самый срочный и практически реализуемый шаг — встраивание автоматической проверки ссылок в процесс подачи статей: это не отменит свободы использования AI, но защитит научную цепочку доказательств и снизит риск нанесения вреда клинике и обществу.

НОВЫЕ СТАТЬИ

22 октября, 2024

Автоматизация аналитики продаж на маркетплейсах:…

22 октября, 2024

Как анализ отзывов и оценок…

22 октября, 2024

Анализ динамики цен и стратегии…

22 октября, 2024

Интеграция данных о продажах с…

БОЛЬШЕ ИНФОРМАЦИИ

Email

sms_systems@inbox.ru

Телефон

+ 7 (985) 982-70-55