Forskere ved University of Toronto's Donelly Centre har udviklet en banebrydende AI-model kaldet PepFlow, der kan forudsige de forskellige former, som peptider antager, med en hidtil uset nøjagtighed.
Peptider er små molekyler, der består af aminosyrer, som er byggestenene i proteiner.
Selvom peptider ligner proteiner, er de meget mindre og mere fleksible, hvilket gør det muligt for dem at folde sig i mange forskellige former.
Et peptids specifikke form er afgørende, fordi den bestemmer, hvordan det interagerer med andre molekyler i kroppen, hvilket igen dikterer dets biologiske funktion.
Forudsigelse af proteiners og peptiders strukturer har længe været en udfordring i biologien. På grund af den komplekse matematik, der er involveret, er det et fremragende problem for maskinlæring.
I de seneste år har AI-modeller som AlphaFold 2 og 3udviklet af Googles DeepMind, har revolutioneret forudsigelsen af proteinstrukturer.
AlphaFold2 bruger deep learning til at forudsige et proteins mest sandsynlige 3D-struktur ud fra dets aminosyresekvens. Men vielvom AlphaFold2 har været en utrolig succes for proteiner, har det sine begrænsninger, når det gælder meget fleksible molekyler som peptider.
"Vi har ikke været i stand til at modellere hele spektret af konformationer for peptider før nu". sagde Osama Abdin, undersøgelsens førsteforfatter.
Pepflow, dokumenteret i en undersøgelse offentliggjort i Nature Machine Intelligence, "udnytter dyb læring til at fange de præcise og nøjagtige konformationer af et peptid inden for få minutter."
PepFlow anvender AI-modeller inspireret af Boltzmann generators. Disse modeller lærer de grundlæggende fysiske principper, der styrer, hvordan et peptids kemiske struktur bestemmer dets spektrum af mulige former.
Det gør det muligt for PepFlow præcist at forudsige strukturer af peptider med usædvanlige egenskaber, f.eks. cirkulære peptider, der er dannet ved makrocyklisering. Makrocykliske peptider er særligt interessante for lægemiddeludvikling på grund af deres unikke bindingsegenskaber.
Det, der adskiller PepFlow fra modeller som AlphaFold2, er dens evne til at forudsige ikke bare én struktur, men hele "energilandskabet" i et peptid.
Energilandskabet repræsenterer alle de mulige former, et peptid kan antage, og hvordan det skifter mellem disse forskellige konformationer.
At indfange denne strukturelle kompleksitet er nøglen til undervisning i, hvordan peptider fungerer i forskellige biologiske sammenhænge.
Forskere ved @UofT har udviklet en #DybdeLæring model, kaldet PepFlow, der kan forudsige alle mulige former for peptider.
PepFlow kan informere lægemiddeludviklingen gennem design af peptider, der fungerer som bindemidler. 1TP5DrugDiscovery
Få mere at vide 👉 https://t.co/eAKOg5e7Cz pic.twitter.com/mYP9YeiCOe
- Donnelly Center (@DonnellyCentre) 27. juni 2024
Betydning
Evnen til at forudsige meget præcise peptidstrukturer har stor betydning for udviklingen af peptidbaserede lægemidler.
"Peptider var fokus for PepFlow-modellen, fordi de er meget vigtige biologiske molekyler, og de er naturligvis meget dynamiske, så vi er nødt til at modellere deres forskellige konformationer for at forstå deres funktion," forklarer han. Philip M. Kim, undersøgelsens ledende investigator.
"De er også vigtige som lægemidler, som man kan se med GLP1-analoger som Ozempic, der bruges til at behandle diabetes og fedme."
Peptidlægemidler har flere fordele i forhold til traditionelle småmolekylære lægemidler og større proteinbaserede lægemidler. De er mere specifikke i deres virkning, har lavere toksicitet end småmolekylære lægemidler og er billigere og lettere at producere end større proteinlægemidler.
PepFlow kan fremskynde opdagelsen og udviklingen af nye peptidbaserede lægemidler ved at gøre det muligt at designe peptider med terapeutiske egenskaber.
"Det tog to et halvt år at udvikle PepFlow og en måned at træne det, men det var umagen værd at bevæge sig til den næste grænse, ud over modeller, der kun forudsiger én struktur af et peptid", konkluderer Abdin.
Det sker efter udgivelsen af EvolutionaryScale ESM3 i denne ugeen grænsesøgende generativ model for biologi, som også fokuserer på proteiner.