AI-startup EvolutionaryScale heeft ESM3 uitgebracht, een generatieve LLM met 98B parameters voor het "programmeren van biologie".
Het bedrijf richt zich op proteomics, de studie van de interacties, functie, samenstelling en structuren van eiwitten en hun cellulaire activiteiten.
Terwijl multimodale modellen zoals GPT-4 tekst of afbeeldingen kunnen genereren, is ESM3 een AI-tool voor het maken van prototypes en het creëren van nieuwe eiwitten.
Wanneer een ribosoom een eiwit maakt, gebruikt het mRNA dat de code bevat voor het maken van een specifiek eiwit.
Elk levend organisme deelt dezelfde genetische code over dezelfde 20 aminozuren. Als je die code zou kunnen lezen en begrijpen, zou je het ribosoom kunnen programmeren om op verzoek een eiwit te maken.
EvolutionaryScale zegt dat ESM3 "al deze biologische gegevens begrijpt, ze vertaalt en vloeiend uitspreekt zodat ze kunnen worden gebruikt als een generatief hulpmiddel".
In plaats van een moeizaam en duur proces van trial and error in een lab, kan ESM3 de vorm en functie van een eiwit voorspellen in een simulatie.
We hebben ESM3 getraind en we zijn enthousiast om EvolutionaryScale te introduceren.
ESM3 is een generatief taalmodel voor het programmeren van biologie. In experimenten ontdekten we dat ESM3 500M jaar evolutie kan simuleren om nieuwe fluorescerende eiwitten te genereren.
Lees meer: https://t.co/iAC3lkj0iV pic.twitter.com/AhWtC4vxlF
- Alex Rives (@alexrives) 25 juni 2024
ESM3 is getraind op miljarden eiwitten die in de natuur voorkomen. Een van de grootste uitdagingen bij het maken van het model was het tokenen van de driedimensionale eiwitstructuur en de functies ervan.
Dit vereiste de ontwikkeling van een manier om elke driedimensionale structuur en functie te schrijven als een opeenvolging van letters met behulp van discrete alfabetten.
Als ESM3 eenmaal getraind is op miljarden eiwitten, spreekt het vloeiend de taal van de natuur en kan het redeneren over de volgorde, structuur en functie van eiwitten.
Als demonstratie van de mogelijkheden van ESM3 gebruikte EvolutionaryScale het om een nieuw groen fluorescerend eiwit (GFP) te genereren. GFP's zijn verantwoordelijk voor de prachtige fluorescentie die we zien in sommige levensvormen zoals kwallen of koralen.
GFP's zijn ongelooflijk zeldzaam in de natuur. Het bedrijf schat dat het nieuwe eiwit dat het esmGFP noemt "een equivalent vertegenwoordigt van meer dan 500 miljoen jaar natuurlijke evolutie uitgevoerd door een evolutionaire simulator".
EvolutionaryScale stelt het ESM3-model openlijk beschikbaar en hoopt dat het "wetenschappers in staat zal stellen om de grenzen van eiwitontwerp en synthetische biologie te verkennen en nieuwe oplossingen te bedenken voor enkele van de belangrijkste problemen waar onze wereld mee te maken heeft".
De dual-use en open-source aard van een tool als ESM3 brengt potentiële risico's met zich mee die het bedrijf zegt te beperken met zijn Responsible Development Framework.
AI gebruiken om de biologie voorspelbaar te programmeren zou kunnen leiden tot eiwitten die koolstof afvangen, hardnekkige vervuilende stoffen zoals plastic opeten of nieuwe medicijnen.
AI-ontwikkelingen in gereedschappen zoals ESM3, AlphaFold en CRISPR kunnen binnenkort leiden tot de uitroeiing van ziekten en milieuproblemen waar wetenschappers al tientallen jaren mee worstelen.