Google DeepMind представил AlphaGenome — ИИ-модель, способную предсказывать влияние генетических изменений. Этот инструмент сравнивают с микроскопом, анализирующим человеческую ДНК. AlphaGenome обрабатывает последовательности длиной до 1 миллиона пар оснований, предсказывая тысячи молекулярных характеристик, связанных с регуляторной активностью. Модель показала наилучшие результаты в более чем 20 тестах по прогнозированию генома.
AlphaGenome обладает рядом уникальных особенностей: поддержка высокого разрешения для длинных последовательностей, многомодальное прогнозирование, эффективная оценка вариантов и новая модель сплайсинга. В настоящее время Google предлагает предварительную версию AlphaGenome через API для некоммерческих исследований.
Доктор Калеб Ларью из Онкологического центра имени Слоуна-Кеттеринга отметил, что это важный шаг в развитии области, так как впервые появилась единая модель, объединяющая анализ удаленных участков ДНК, высокую точность и решение различных геномных задач.
Модель анализирует до миллиона пар оснований ДНК с разрешением на уровне отдельных нуклеотидов. Это позволяет охватывать удаленные регуляторные участки генов. Обучение модели заняло всего 4 часа, при этом вычислительные ресурсы были в два раза меньше, чем для предыдущей модели Enformer.
AlphaGenome способен предсказывать широкий спектр характеристик, включая позиции начала и окончания генов, места сплайсинга, количество производимой РНК и взаимодействия ДНК с белками. Данные для обучения были получены из публичных источников, таких как ENCODE, GTEx и других.
Особое внимание уделено анализу сплайсинга, ошибки в котором могут вызывать редкие генетические заболевания. AlphaGenome впервые позволяет напрямую моделировать позиции соединений и уровень экспрессии.
В тестах AlphaGenome превзошел существующие модели в 22 из 24 оценок прогнозирования последовательностей ДНК и в 24 из 26 оценок влияния вариантов. Это единственная модель, способная одновременно предсказывать все анализируемые характеристики.
AlphaGenome может использоваться в различных областях: изучение заболеваний, синтетическая биология и фундаментальные исследования. Например, модель уже помогла изучить механизм мутации, связанной с Т-клеточным острым лимфобластным лейкозом.
Профессор Марк Мансур из Университетского колледжа Лондона отметил, что AlphaGenome станет ценным инструментом для понимания роли неконсервативных вариантов в развитии таких заболеваний, как рак.
Несмотря на прогресс, AlphaGenome пока не может точно анализировать влияние очень удаленных регуляторных элементов (более 100 тысяч пар оснований). Также модель не предназначена для прогнозирования на уровне индивидуальных геномов и не учитывает все факторы, влияющие на сложные признаки и заболевания.
В будущем функциональность AlphaGenome может быть расширена за счет увеличения объема обучающих данных, включения большего числа видов и молекулярных характеристик.
sms_systems@inbox.ru
+ 7 (985) 982-70-55