KI-Modell simuliert 500 Millionen Jahre Evolution, um ein neues fluoreszierendes Protein zu entwickeln

Juli 19, 2024

  • Forscher haben ein KI-Modell entwickelt, um völlig neue, funktionelle Proteine zu erzeugen
  • Das Protein, das in der Natur noch nie gesehen wurde, ähnelt denen, die in der Biolumineszenz verwendet werden
  • Dieser Prozess umgeht im Wesentlichen Millionen von Jahren der Proteinevolution
Ai-Protein

Wissenschaftler haben ein KI-System entwickelt, das in der Lage ist, Hunderte von Millionen Jahren der Proteinevolution zu simulieren und ein neuartiges fluoreszierendes Protein zu schaffen, das in der Natur nicht vorkommt.

Das Forscherteam unter der Leitung von Alexander Rives von EvolutionaryScale hat ein großes Sprachmodell (Large Language Model, LLM) namens ESM3 entwickelt, um Informationen über Proteinsequenzen, -strukturen und -funktionen zu verarbeiten und zu generieren. 

Durch Training mit Daten von Milliarden natürlicher Proteine konnte ESM3 vorhersagen, wie sich Proteine im Laufe der Zeit entwickeln und verändern könnten.

Die Forscher argumentieren, dass ESM3 nicht einfach vorhandene Proteininformationen abruft oder neu kombiniert. 

Stattdessen scheint sie ein Verständnis für die grundlegenden Prinzipien der Proteinstruktur und -funktion entwickelt zu haben, das es ihr ermöglicht, wirklich neuartige Designs zu entwickeln.

"ESM3 ist ein emergenter Simulator, der durch das Lösen einer Token-Vorhersageaufgabe auf Daten, die durch die Evolution erzeugt wurden, gelernt wurde", erklären die Forscher in der Studie.

"Es wurde die Theorie aufgestellt, dass neuronale Netze die zugrunde liegende Struktur der Daten entdecken, für die sie trainiert wurden. Auf diese Weise würde die Lösung der Token-Vorhersageaufgabe erfordern, dass das Modell die tiefe Struktur lernt, die bestimmt, welche Schritte die Evolution unternehmen kann, d. h. die grundlegende Biologie der Proteine."

Um das Modell zu testen, veranlasste das Team ESM3, ein völlig neues grün fluoreszierendes Protein (GFP) zu entwickeln - eine Art Protein, das für das Biolumineszenzlicht in bestimmten Meerestieren verantwortlich ist und in der biotechnologischen Forschung weit verbreitet ist.

Das von der KI erzeugte Protein mit dem Namen esmGFP teilt nur 58% seiner Sequenz mit den ähnlichsten bekannten fluoreszierenden Proteinen.

Bemerkenswert ist, dass esmGFP eine vergleichbare Helligkeit wie natürlich vorkommende GFPs aufweist und die charakteristische tonnenförmige Struktur beibehält, die für die Fluoreszenz wesentlich ist. 

Die Forscher schätzen, dass die Herstellung eines Proteins, das so weit von den bekannten GFPs entfernt ist, über 500 Millionen Jahre natürlicher Evolution erfordert hätte.

Mehr über die Studie

Der Prozess zur Erzeugung von esmGFP umfasst mehrere wichtige Schritte:

  1. Daten: Die Forscher trainierten ESM3 mit etwa 2,78 Milliarden natürlichen Proteinen, die in Sequenz- und Strukturdatenbanken gesammelt wurden. Dazu gehörten Daten aus UniRef, MGnify, JGI und anderen Quellen.
  2. Architektur: ESM3 verwendet eine auf Transformern basierende Architektur mit einigen Modifikationen, einschließlich eines "geometrischen Aufmerksamkeits"-Mechanismus zur Verarbeitung von 3D-Proteinstrukturen.
  3. Eingabeaufforderung: Die Forscher versorgten ESM3 mit minimalen Strukturinformationen aus einer GFP-Vorlage (fluoreszierendes Protein).
  4. Generation: ESM3 nutzte diese Aufforderung, um in einem iterativen Prozess neue Proteinsequenzen und -strukturen zu erzeugen.
  5. Filtern: Tausende von Designkandidaten wurden rechnerisch ausgewertet und gefiltert, um die stärksten Kandidaten zu finden.
  6. Experimentelle Prüfung: Die vielversprechendsten Designs wurden synthetisiert und im Labor auf ihre Fluoreszenzaktivität getestet.
  7. Verfeinerung: Nachdem sie eine schwache, aber weit entfernte GFP-Variante identifiziert hatten, nutzten die Forscher ESM3, um das Design weiter zu optimieren und schließlich ein helleres fluoreszierendes Protein herzustellen.

Die Auswirkungen dieser Forschung gehen über die Schaffung eines einzigen neuen Proteins hinaus. 

ESM3 zeigt, dass es in der Lage ist, Räume für das Proteindesign zu erforschen, die weit von dem entfernt sind, was die natürliche Evolution hervorgebracht hat, und eröffnet damit neue Wege für die Schaffung von Proteinen mit gewünschten Funktionen oder Eigenschaften.

Dr. Tiffany Taylor, Professorin für mikrobielle Ökologie und Evolution an der University of Bath, die nicht an der Studie beteiligt war, gegenüber LiveScience: "Im Moment fehlt uns noch das grundlegende Verständnis dafür, wie sich Proteine, insbesondere solche, die 'neu in der Wissenschaft' sind, verhalten, wenn sie in ein lebendes System eingebracht werden, aber dies ist ein cooler neuer Schritt, der es uns ermöglicht, die synthetische Biologie auf eine neue Art und Weise anzugehen."

"KI-Modelle wie ESM3 werden die Entdeckung neuer Proteine ermöglichen, die die natürliche Selektion niemals zulassen würde, und damit Innovationen im Protein-Engineering schaffen, die die Evolution nicht zulässt", fügte Dr. Taylor hinzu.

Generatives Proteindesign

Die KI-gesteuerte Proteinforschung und -entwicklung hat ein hohes Niveau erreicht, mit DeepMindAlphaFold 3 mit unglaublicher Genauigkeit vorhersagen, wie sich Proteine falten. 

Von der künstlichen Intelligenz entworfene Proteine haben auch gezeigt ausgezeichnete Bindungsstärkeund zeigen damit, dass sie einen praktischen Nutzen haben. 

Wie bei jeder sich schnell entwickelnden Technologie, die in irgendeiner Weise mit der Biologie interagiert, gibt es jedoch auch Risiken. 

Erstens könnten von der KI entwickelte Proteine, wenn sie in die Umwelt entweichen, mit natürlichen Ökosystemen interagieren und sogar natürliche Proteine verdrängen oder bestehende biologische Prozesse stören. 

Zweitens könnten sie unerwartete Wechselwirkungen in lebenden Organismen auslösen und möglicherweise sogar schädliche biologische Wirkstoffe oder Toxine erzeugen. 

Forscher forderten kürzlich ethische Leitplanken für das Design von KI-Proteinen, um riskante Ergebnisse in diesem spannenden, wenn auch unberechenbaren Bereich zu verhindern. 

Join The Future


HEUTE ABONNIEREN

Klar, prägnant, umfassend. Behalten Sie den Überblick über KI-Entwicklungen mit DailyAI

Sam Jeans

Sam ist ein Wissenschafts- und Technologiewissenschaftler, der in verschiedenen KI-Startups gearbeitet hat. Wenn er nicht gerade schreibt, liest er medizinische Fachzeitschriften oder kramt in Kisten mit Schallplatten.

×

KOSTENLOSES PDF EXKLUSIV
Mit DailyAI immer einen Schritt voraus

Melden Sie sich für unseren wöchentlichen Newsletter an und erhalten Sie exklusiven Zugang zum neuesten eBook von DailyAI: 'Mastering AI Tools: Ihr Leitfaden für mehr Produktivität im Jahr 2024".

*Mit der Anmeldung zu unserem Newsletter akzeptieren Sie unsere Datenschutzbestimmungen und unsere Bedingungen und Konditionen