DeepMind meddelade AlphaFold 3, den senaste iterationen av sitt proteinveckningsprojekt.
AlphaFold 3liksom sina föregångare, i första hand förutspår hur proteiner viks baserat på deras aminosyrasekvenser.
Proteiner, som är byggstenarna i allt organiskt liv, består av långa kedjor av aminosyror som likt "origami" viks till 3D-strukturer som bestämmer deras funktioner.
Genom att förstå hur dessa strukturer viks öppnas dörren till att dechiffrera de molekylära mekanismer som ligger till grund för hälsa och sjukdom.
I vissa fall kan proteiner till exempel bli felveckade, vilket stör deras normala funktion och bidrar till utvecklingen av sjukdomar som Alzheimers och Parkinsons.
Felveckning kan störa cellhälsan genom att dysfunktionella proteiner ansamlas som kan skada celler och vävnader.
Genom att klarlägga mekanismerna bakom denna process kan forskarna utveckla läkemedel som effektivt rensar kroppen från ackumulerade felveckade proteiner eller interventioner som förhindrar att felveckning överhuvudtaget uppstår.
Vi presenterar AlphaFold 3
DeepMind nyligen meddelat AlphaFold 3som innehåller en förbättrad version av Evoformer-modulen, en del av den arkitektur för djupinlärning som ligger till grund för AlphaFold 2.
När Evoformer-modulen har bearbetat de ingående molekylerna använder AlphaFold 3 ett nytt diffusionsnätverk för att sätta ihop de förutsagda strukturerna.
Detta nätverk liknar de som används i AI-bildgeneratorer som DALL-E. Den börjar med ett "moln" av atomer och förfinar strukturen iterativt i en serie steg tills den konvergerar mot en slutlig, sannolikt korrekt molekylkonfiguration.
AlphaFold 3-modellen har utvecklats till att omfatta mer än bara proteiner - den fångar även interaktioner mellan DNA, RNA och ligander. En ligand är en molekyl som binder till en annan molekyl, vanligtvis ett protein, för att bilda ett komplex och ofta utlöser ett biologiskt svar eller en förändring i proteinets funktion.
Isomorphic Labs, som samarbetade med DeepMind på AlphaFold 3-projektet, arbetar redan med läkemedelsföretag och tillämpar modellen på verkliga utmaningar inom läkemedelsdesign.
DeepMind har också lanserat AlphaFold Serverär en kostnadsfri och användarvänlig plattform som gör det möjligt för forskare att utnyttja kraften i AlphaFold 3 utan omfattande beräkningsresurser eller expertis inom maskininlärning.
En kort historik över AlphaFold-projektet
Före maskininlärning var det astronomiskt tidskrävande att beräkna antalet konfigurationer som ett protein kunde anta.
AlphaFold-projektet startade 2016 och avslutades 2018, kort efter AlphaGos historiska seger mot Lee Sedol, en internationell Go-spelare i toppklass.
Under 2018, DeepMind AlphaFold 1, den första versionen av AI-systemet, presenterades på CASP13 (Kritisk bedömning av prediktion av proteinstruktur) utmaning.
Denna tävling, som äger rum vartannat år, samlar forskargrupper från hela världen för att testa noggrannheten i deras förutsägelser av proteinstrukturer mot verkliga experimentella data.
AlphaFold 1 placerade sig på första plats i tävlingen, en viktig milstolpe inom beräkningsbiologi.
Två år senare, vid CASP14 2020, DeepMind presenterade AlphaFold 2 och visade en så hög noggrannhet att forskarvärlden ansåg att proteinveckningsproblemet i princip var löst.
AlphaFold 2:s prestanda var anmärkningsvärd. Det uppnådde en median noggrannhetspoäng på 92,4 GDT (Global Distance Test) över alla mål.
För att sätta detta i perspektiv anses en poäng på 90 GDT vara konkurrenskraftig med resultat som erhållits med experimentella metoder. Artikeln om AlphaFold 2-metoderna har sedan dess fått över 20.000 citeringar, vilket placerar den bland de 500 mest citerade artiklarna inom alla vetenskapliga områden.
AlphaFold har bidragit till många nya forskningsprojekt, t.ex. studier av proteiner som kan bryta ned miljöföroreningar som plast och förbättrad förståelse för ovanliga tropiska sjukdomar som Leishmaniasis och Chagas.
I juli 2021, DeepMindi samarbete med EMBL:s European Bioinformatics Institute (EMBL-EBI), lanserade AlphaFold Protein Structure Database, som ger tillgång till över 350.000 proteinstrukturprediktioner, inklusive hela det mänskliga proteomet.
Denna databas har sedan dess utökats till att omfatta över 200 miljoner strukturer, vilket täcker nästan alla katalogiserade proteiner som är kända av vetenskapen.
Hittills har över en miljon användare i över 190 länder haft tillgång till AlphaFold Protein Structure Database, vilket har möjliggjort upptäckter inom områden som sträcker sig från medicin till jordbruk och mycket mer.
AlphaFold 3 innebär en ny iteration för detta klassledande system för proteinupptäckt och -analys.