AAAI 2026 внедрила масштабную проверку научных статей

Строева Марина
Социальные сети

На конференции AAAI 2026 (одной из главных ИИ-конференций мира) состоялся исторический эксперимент: впервые в истории крупного научного форума была официально внедрена система ИИ-рецензирования в рамках реального «двойного слепого» процесса.

Результаты оказались ошеломляющими: ИИ не только справился с колоссальным объемом

Из-за взрывного роста числа заявок (почти 30 000 статей, большинство из которых — из Китая) AAAI пришлось нанять 28 000 рецензентов-людей. Чтобы снизить нагрузку и повысить качество, был запущен пилотный проект:

Охват: 22 977 научных работ прошли полную ИИ-проверку.

Скорость: весь объем был обработан менее чем за 24 часа.

Стоимость: стоимость глубокого анализа одной статьи составила менее $1.

Технология: Система работала на базе GPT-5 (при поддержке OpenAI) с использованием сложных многоэтапных рабочих процессов.

Разработчики отказались от простого «скармливания» текста модели. ИИ-рецензент работал по сложной архитектуре:

Сюжет (Story): проверка логики вклада автора и обоснованности гипотез.

Структура (Presentation): анализ ясности изложения и грамотности.

Эксперименты (Evaluations): использование интерпретатора Python для проверки статистической значимости и корректности тестов.

Точность (Correctness): верификация математических формул и кода алгоритмов через «песочницу».

Значимость (Significance): поиск по базе опубликованных работ (через поисковые API) для оценки реальной новизны и поиска скрытых заимствований. После этого система запускала модуль «саморефлексии», где ИИ критиковал собственный черновик рецензии на предмет галлюцинаций.

Исследовательская группа собрала 5 834 отзыва от авторов и членов программного комитета. По 9 ключевым критериям ИИ победил человека в 6 пунктах:

Глубокие технические ошибки: ИИ оказался гораздо внимательнее к деталям (+0.67 балла по шкале Ликерта).

Контрпримеры: ИИ находил важные аргументы, которые авторы или рецензенты-люди упускали из виду (+0.61).

Рекомендации по улучшению: ИИ давал более конкретные советы по исправлению графиков, структуры и дизайна экспериментов.

Объективность: У ИИ отсутствуют «научные клановые войны» и эмоциональные предпочтения.

Слабые места ИИ:

Придирки к мелочам: ИИ часто раздувал мелкие огрехи оформления до уровня фатальных ошибок.

Отсутствие интуиции: машина плохо справляется с определением «революционности» идей, которые выходят за рамки текущих парадигм.

Информационный перегруз: многостраничные отчеты ИИ с десятками мелких замечаний иногда усложняли работу редакторам.

Одним из главных опасений были «галлюцинации» — вымышленные ссылки. Команда проверила 1356 ссылок в ИИ-отчетах через инструмент GPTZero. Результат: 1346 ссылок были абсолютно точными. Всего 2 ошибки, которые оказались путаницей в аббревиатурах конференций, а не вымыслом.

Эксперимент AAAI 2026 показал, что ИИ готов взять на себя «грязную работу» научного сообщества: проверку формул, поиск пропущенных ссылок и аудит данных. Это освобождает ученых для самого важного — оценки «души» исследования и его влияния на реальный мир.

Более 61% участников выразили желание, чтобы ИИ продолжал участвовать в рецензировании в будущем. Литературные «cancer cells» (преднамеренные ошибки), внедренные в статьи для теста новой системы (бенчмарк SPECS), ИИ выявлял на 20% эффективнее стандартных моделей.

Мир науки меняется: теперь рецензирование — это симбиоз кремниевого хладнокровия и человеческой интуиции.

НОВЫЕ СТАТЬИ

22 октября, 2024

Автоматизация аналитики продаж на маркетплейсах:…

22 октября, 2024

Как анализ отзывов и оценок…

22 октября, 2024

Анализ динамики цен и стратегии…

22 октября, 2024

Интеграция данных о продажах с…

БОЛЬШЕ ИНФОРМАЦИИ

Email

sms_systems@inbox.ru

Телефон

+ 7 (985) 982-70-55