На конференции AAAI 2026 (одной из главных ИИ-конференций мира) состоялся исторический эксперимент: впервые в истории крупного научного форума была официально внедрена система ИИ-рецензирования в рамках реального «двойного слепого» процесса.
Результаты оказались ошеломляющими: ИИ не только справился с колоссальным объемом
Из-за взрывного роста числа заявок (почти 30 000 статей, большинство из которых — из Китая) AAAI пришлось нанять 28 000 рецензентов-людей. Чтобы снизить нагрузку и повысить качество, был запущен пилотный проект:
Охват: 22 977 научных работ прошли полную ИИ-проверку.
Скорость: весь объем был обработан менее чем за 24 часа.
Стоимость: стоимость глубокого анализа одной статьи составила менее $1.
Технология: Система работала на базе GPT-5 (при поддержке OpenAI) с использованием сложных многоэтапных рабочих процессов.
Разработчики отказались от простого «скармливания» текста модели. ИИ-рецензент работал по сложной архитектуре:
Сюжет (Story): проверка логики вклада автора и обоснованности гипотез.
Структура (Presentation): анализ ясности изложения и грамотности.
Эксперименты (Evaluations): использование интерпретатора Python для проверки статистической значимости и корректности тестов.
Точность (Correctness): верификация математических формул и кода алгоритмов через «песочницу».
Значимость (Significance): поиск по базе опубликованных работ (через поисковые API) для оценки реальной новизны и поиска скрытых заимствований. После этого система запускала модуль «саморефлексии», где ИИ критиковал собственный черновик рецензии на предмет галлюцинаций.
Исследовательская группа собрала 5 834 отзыва от авторов и членов программного комитета. По 9 ключевым критериям ИИ победил человека в 6 пунктах:
Глубокие технические ошибки: ИИ оказался гораздо внимательнее к деталям (+0.67 балла по шкале Ликерта).
Контрпримеры: ИИ находил важные аргументы, которые авторы или рецензенты-люди упускали из виду (+0.61).
Рекомендации по улучшению: ИИ давал более конкретные советы по исправлению графиков, структуры и дизайна экспериментов.
Объективность: У ИИ отсутствуют «научные клановые войны» и эмоциональные предпочтения.
Слабые места ИИ:
Придирки к мелочам: ИИ часто раздувал мелкие огрехи оформления до уровня фатальных ошибок.
Отсутствие интуиции: машина плохо справляется с определением «революционности» идей, которые выходят за рамки текущих парадигм.
Информационный перегруз: многостраничные отчеты ИИ с десятками мелких замечаний иногда усложняли работу редакторам.
Одним из главных опасений были «галлюцинации» — вымышленные ссылки. Команда проверила 1356 ссылок в ИИ-отчетах через инструмент GPTZero. Результат: 1346 ссылок были абсолютно точными. Всего 2 ошибки, которые оказались путаницей в аббревиатурах конференций, а не вымыслом.
Эксперимент AAAI 2026 показал, что ИИ готов взять на себя «грязную работу» научного сообщества: проверку формул, поиск пропущенных ссылок и аудит данных. Это освобождает ученых для самого важного — оценки «души» исследования и его влияния на реальный мир.
Более 61% участников выразили желание, чтобы ИИ продолжал участвовать в рецензировании в будущем. Литературные «cancer cells» (преднамеренные ошибки), внедренные в статьи для теста новой системы (бенчмарк SPECS), ИИ выявлял на 20% эффективнее стандартных моделей.
Мир науки меняется: теперь рецензирование — это симбиоз кремниевого хладнокровия и человеческой интуиции.
sms_systems@inbox.ru
+ 7 (985) 982-70-55