DeepMind annoncée AlphaFold 3, la dernière itération de son projet de repliement des protéines.
AlphaFold 3Comme ses prédécesseurs, il prédit principalement la façon dont les protéines se replient sur la base de leurs séquences d'acides aminés.
Les protéines, éléments constitutifs de toute vie organique, sont constituées de longues chaînes d'acides aminés qui se plient comme un origami pour former des structures en trois dimensions qui déterminent leurs fonctions.
Comprendre comment ces structures se replient ouvre la voie au décryptage des mécanismes moléculaires qui sous-tendent la santé et la maladie.
Par exemple, dans certains cas, les protéines peuvent être mal repliées, ce qui perturbe leur fonction normale et contribue au développement de maladies telles que les maladies d'Alzheimer et de Parkinson.
Les erreurs de pliage peuvent nuire à la santé cellulaire en accumulant des protéines dysfonctionnelles qui peuvent endommager les cellules et les tissus.
En élucidant les mécanismes à l'origine de ce processus, les scientifiques peuvent mettre au point des médicaments qui débarrassent efficacement l'organisme des protéines mal repliées accumulées ou des interventions qui empêchent le mauvais pliage de se produire en premier lieu.
Présentation d'AlphaFold 3
DeepMind a récemment annoncé AlphaFold 3qui présente une version améliorée du module Evoformer, qui fait partie de l'architecture d'apprentissage en profondeur sur laquelle repose AlphaFold 2.
Une fois que le module Evoformer a traité les molécules d'entrée, AlphaFold 3 utilise un nouveau réseau de diffusion pour assembler les structures prédites.
Ce réseau est similaire à ceux utilisés dans les générateurs d'images d'IA tels que DALL-E. Il part d'un "nuage" d'atomes et affine la structure de manière itérative au cours d'une série d'étapes jusqu'à ce qu'il converge vers une configuration moléculaire finale, probablement précise.
Le modèle AlphaFold 3 a évolué au-delà des seules protéines - il capture également les interactions de l'ADN, de l'ARN et des ligands. Un ligand est une molécule qui se lie à une autre molécule, généralement une protéine, pour former un complexe et déclenche souvent une réponse biologique ou un changement dans la fonction de la protéine.
Isomorphic Labsqui a collaboré avec DeepMind sur le projet AlphaFold 3, travaille déjà avec des entreprises pharmaceutiques, appliquant le modèle à des défis réels de conception de médicaments.
DeepMind a également lancé l'initiative Serveur AlphaFoldAlphaFold 3 est une plateforme gratuite et conviviale qui permet aux chercheurs d'exploiter la puissance d'AlphaFold 3 sans disposer de ressources informatiques importantes ou d'une expertise en apprentissage automatique.
Un bref historique du projet AlphaFold
Avant l'apprentissage automatique, le calcul du nombre de configurations que pouvait prendre une protéine prenait un temps astronomique.
Le projet AlphaFold a débuté en 2016 et s'est achevé en 2018, peu après la victoire historique d'AlphaGo contre Lee Sedol, un grand joueur international de Go.
En 2018, DeepMind a présenté AlphaFold 1, la première version du système d'intelligence artificielle, lors de la conférence de l'Union européenne. CASP13 (Évaluation critique de la prédiction de la structure des protéines).
Ce concours bisannuel rassemble des groupes de recherche du monde entier qui testent la précision de leurs prédictions de structures protéiques par rapport à des données expérimentales réelles.
AlphaFold 1 s'est classé premier dans la compétition, ce qui constitue une étape importante dans le domaine de la biologie informatique.
Deux ans plus tard, lors de la 14e édition du CASP en 2020, DeepMind a présenté AlphaFold 2, démontrant une précision si élevée que la communauté scientifique a considéré que le problème du repliement des protéines était essentiellement résolu.
Les performances d'AlphaFold 2 ont été remarquables. Il a obtenu une précision médiane de 92,4 GDT (Global Distance Test) sur l'ensemble des cibles.
Pour mettre cela en perspective, un score de 90 GDT est considéré comme compétitif par rapport aux résultats obtenus par des méthodes expérimentales. L'article sur les méthodes AlphaFold 2 a depuis reçu plus de 20 000 citations, ce qui le place parmi les 500 articles les plus cités dans tous les domaines scientifiques.
AlphaFold a joué un rôle déterminant dans de nombreux projets de recherche novateurs, tels que l'étude des protéines susceptibles de dégrader les polluants environnementaux, comme les plastiques, et l'amélioration de notre compréhension de maladies tropicales peu courantes comme la leishmaniose et la maladie de Chagas.
En juillet 2021, DeepMinden partenariat avec l'Institut européen de bioinformatique de l'EMBL (EMBL-EBI), a publié la base de données AlphaFold sur la structure des protéines, qui donne accès à plus de 350 000 prédictions sur la structure des protéines, y compris le protéome humain complet.
Cette base de données a depuis été étendue à plus de 200 millions de structures, couvrant la quasi-totalité des protéines cataloguées connues de la science.
À ce jour, la base de données AlphaFold sur la structure des protéines a été consultée par plus d'un million d'utilisateurs dans plus de 190 pays, ce qui a permis des découvertes dans des domaines allant de la médecine à l'agriculture et au-delà.
AlphaFold 3 est une nouvelle itération de ce système de découverte et d'analyse des protéines, le meilleur de sa catégorie.