DeepMind объявил AlphaFold 3Это последняя итерация проекта по складыванию белков.
AlphaFold 3Как и его предшественники, он в первую очередь предсказывает, как складываются белки, основываясь на их аминокислотных последовательностях.
Белки, строительные блоки всей органической жизни, состоят из длинных цепочек аминокислот, которые складываются, как оригами, в трехмерные структуры, определяющие их функции.
Понимание того, как складываются эти структуры, открывает путь к расшифровке молекулярных механизмов, лежащих в основе здоровья и болезней.
Например, в некоторых случаях белки могут превращаться в неправильную форму, что нарушает их нормальное функционирование и способствует развитию таких заболеваний, как болезнь Альцгеймера и Паркинсона.
Неправильное фолдинг может нарушать здоровье клеток, накапливая дисфункциональные белки, которые могут повреждать клетки и ткани.
Разгадав механизмы, лежащие в основе этого процесса, ученые смогут разработать лекарства, эффективно очищающие организм от накопившихся неправильных белков, или меры, предотвращающие возникновение неправильного фолдинга.
Представляем AlphaFold 3
DeepMind недавно объявил AlphaFold 3В нем представлена улучшенная версия модуля Evoformer, который является частью архитектуры глубокого обучения, лежащей в основе AlphaFold 2.
После того как модуль Evoformer обработает входные молекулы, AlphaFold 3 использует новую диффузионную сеть для сборки предсказанных структур.
Эта сеть похожа на те, что используются в генераторах изображений искусственного интеллекта, таких как DALL-E. Он начинает с "облака" атомов и итеративно уточняет структуру в течение ряда шагов, пока не сходится к окончательной, вероятно, точной конфигурации молекулы.
Модель AlphaFold 3 не ограничивается только белками - она также отражает взаимодействие ДНК, РНК и лигандов. Лиганд - это молекула, которая связывается с другой молекулой, обычно белком, образуя комплекс, и часто вызывает биологический ответ или изменение функции белка.
Isomorphic Labsкоторый сотрудничал с DeepMind работающий над проектом AlphaFold 3, уже сотрудничает с фармацевтическими компаниями, применяя модель для решения реальных задач по разработке лекарств.
DeepMind также запустила Сервер AlphaFoldбесплатная и удобная платформа, которая позволяет исследователям использовать возможности AlphaFold 3, не имея больших вычислительных ресурсов или опыта в машинном обучении.
Краткая история проекта AlphaFold
До появления машинного обучения вычисление количества конфигураций, которые может принимать белок, занимало астрономическое количество времени.
Проект AlphaFold стартовал в 2016 году и завершился в 2018-м, вскоре после исторической победы AlphaGo над Ли Седолем, лучшим международным игроком в го.
В 2018 г, DeepMind AlphaFold 1, первая версия системы искусственного интеллекта, была представлена на выставке CASP13 (Критическая оценка предсказания структуры белков) вызов.
В этом конкурсе, который проводится раз в два года, участвуют исследовательские группы со всего мира, чтобы проверить точность предсказаний структуры белков на основе реальных экспериментальных данных.
AlphaFold 1 занял первое место в конкурсе, что стало важной вехой в вычислительной биологии.
Два года спустя, на CASP14 в 2020 году, DeepMind представила AlphaFold 2, продемонстрировав настолько высокую точность, что научное сообщество посчитало проблему сворачивания белков практически решенной.
AlphaFold 2 продемонстрировал впечатляющие результаты. Она достигла медианного показателя точности 92,4 GDT (Global Distance Test) по всем целям.
В перспективе оценка 90 GDT считается конкурентоспособной с результатами, полученными экспериментальными методами. Статья о методах AlphaFold 2 с тех пор получила более 20 000 ссылок, что позволило ей войти в число 500 наиболее цитируемых работ во всех научных областях.
AlphaFold сыграла важную роль в многочисленных новых исследовательских проектах, таких как изучение белков, способных разлагать загрязнители окружающей среды, например, пластик, и улучшение нашего понимания таких редких тропических заболеваний, как лейшманиоз и болезнь Шагаса.
В июле 2021 года, DeepMindсовместно с Европейским институтом биоинформатики EMBL (EMBL-EBI) выпустила базу данных AlphaFold Protein Structure Database, которая предоставляет доступ к более чем 350 000 прогнозов структуры белков, включая полный протеом человека.
С тех пор эта база данных была расширена и включает в себя более 200 миллионов структур, охватывающих почти все известные науке белки.
На сегодняшний день доступ к базе данных AlphaFold Protein Structure Database получили более миллиона пользователей в более чем 190 странах мира, что позволило совершить открытия в самых разных областях - от медицины до сельского хозяйства и не только.
AlphaFold 3 - очередная итерация этой лучшей в своем классе системы обнаружения и анализа белков.