Modelo de IA simula 500 milhões de anos de evolução para criar uma nova proteína fluorescente

19 de julho de 2024

  • Os investigadores criaram um modelo de IA para gerar proteínas totalmente novas e funcionais
  • A proteína, nunca antes vista na natureza, reflecte as utilizadas na bioluminescência
  • Este processo contorna essencialmente milhões de anos de evolução das proteínas
Proteína Ai

Os cientistas desenvolveram um sistema de IA capaz de simular centenas de milhões de anos de evolução de proteínas, criando uma nova proteína fluorescente diferente de qualquer outra encontrada na natureza.

A equipa de investigação, liderada por Alexander Rives da EvolutionaryScale, criou um modelo de linguagem de grande dimensão (LLM) denominado ESM3 para processar e gerar informações sobre sequências, estruturas e funções de proteínas. 

Ao treinar com dados de milhares de milhões de proteínas naturais, o ESM3 aprendeu a prever a forma como as proteínas podem evoluir e mudar ao longo do tempo.

Os investigadores afirmam que o ESM3 não se limita a recuperar ou a recombinar a informação existente sobre as proteínas. 

Em vez disso, parece ter desenvolvido uma compreensão dos princípios fundamentais que regem a estrutura e a função das proteínas, o que lhe permite gerar concepções verdadeiramente inovadoras.

"O ESM3 é um simulador emergente que foi aprendido a partir da resolução de uma tarefa de previsão de tokens em dados gerados pela evolução", explicam os investigadores no estudo.

"Foi teorizado que as redes neuronais descobrem a estrutura subjacente dos dados para os quais são treinadas para prever. Desta forma, a resolução da tarefa de previsão de tokens exigiria que o modelo aprendesse a estrutura profunda que determina os passos que a evolução pode dar, ou seja, a biologia fundamental das proteínas."

Para testar o modelo, a equipa levou a ESM3 a conceber uma proteína verde fluorescente (GFP) totalmente nova - um tipo de proteína responsável pela bioluminescência em certos animais marinhos e muito utilizada na investigação biotecnológica.

A proteína gerada por IA, denominada esmGFP, partilha apenas 58% da sua sequência com as proteínas fluorescentes conhecidas mais semelhantes.

O esmGFP apresenta uma luminosidade comparável à dos GFPs naturais e mantém a estrutura caraterística em forma de barril, essencial para a fluorescência. 

Os investigadores estimam que a produção de uma proteína tão distante das GFPs conhecidas teria levado mais de 500 milhões de anos de evolução natural.

Mais informações sobre o estudo

O processo de geração de esmGFP envolveu várias etapas fundamentais:

  1. Dados: Os investigadores treinaram o ESM3 em cerca de 2,78 mil milhões de proteínas naturais recolhidas de bases de dados de sequências e estruturas. Isto inclui dados da UniRef, MGnify, JGI e outras fontes.
  2. Arquitetura: O ESM3 utiliza uma arquitetura baseada em transformadores com algumas modificações, incluindo um mecanismo de "atenção geométrica" para processar estruturas proteicas 3D.
  3. Prompting: Os investigadores forneceram ao ESM3 informações estruturais mínimas a partir de um modelo de GFP (a proteína fluorescente).
  4. Geração: O ESM3 utilizou este prompt para gerar novas sequências e estruturas de proteínas através de um processo iterativo.
  5. Filtragem: Milhares de projectos candidatos foram avaliados computacionalmente e filtrados para encontrar os candidatos mais fortes.
  6. Ensaios experimentais: Os modelos mais promissores foram sintetizados e testados em laboratório quanto à atividade fluorescente.
  7. Refinamento: Depois de identificar uma variante de GFP fraca mas distante, os investigadores utilizaram o ESM3 para otimizar ainda mais o desenho, produzindo finalmente uma proteína fluorescente mais brilhante.

As implicações desta investigação vão para além da criação de uma única proteína nova. 

O ESM3 demonstra a capacidade de explorar espaços de conceção de proteínas muito distantes do que a evolução natural produziu, abrindo novas vias para a criação de proteínas com as funções ou propriedades desejadas.

Dr. Tiffany Taylor, Professor de Ecologia Microbiana e Evolução na Universidade de Bath, que não esteve envolvido no estudo, disse ao LiveScience: Neste momento, ainda nos falta a compreensão fundamental do modo como as proteínas, especialmente as "novas para a ciência", se comportam quando introduzidas num sistema vivo, mas este é um novo passo interessante que nos permite abordar a biologia sintética de uma nova forma".

"A modelação por IA como o ESM3 permitirá a descoberta de novas proteínas que os constrangimentos da seleção natural nunca permitiriam, criando inovações na engenharia de proteínas que a evolução não consegue", acrescentou o Dr. Taylor.

Conceção generativa de proteínas

A investigação e a conceção de proteínas com base na IA atingiram um ponto de viragem, com DeepMind's AlphaFold 3 prevendo como as proteínas se dobram com uma precisão incrível. 

As proteínas concebidas por IA também demonstraram excelente resistência de ligação, mostrando que têm utilizações práticas. 

No entanto, como acontece com qualquer tecnologia em rápida evolução que, de alguma forma, interage com a biologia, existem riscos. 

Em primeiro lugar, se as proteínas concebidas pela IA se escapassem para o ambiente, poderiam potencialmente interagir com os ecossistemas naturais, chegando mesmo a ultrapassar as proteínas naturais ou a perturbar os processos biológicos existentes. 

Em segundo lugar, podem desencadear interacções inesperadas nos organismos vivos, podendo mesmo criar agentes biológicos nocivos ou toxinas. 

Os investigadores apelaram recentemente a barreiras éticas para a conceção de proteínas de IA, a fim de evitar resultados arriscados neste domínio excitante, embora imprevisível. 

Junte-se ao futuro


SUBSCREVER HOJE

Claro, conciso e abrangente. Fique a par dos desenvolvimentos da IA com DailyAI

Calças de ganga Sam

Sam é um escritor de ciência e tecnologia que trabalhou em várias startups de IA. Quando não está a escrever, pode ser encontrado a ler revistas médicas ou a vasculhar caixas de discos de vinil.

×

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI

Subscreva a nossa newsletter semanal e receba acesso exclusivo ao último livro eletrónico do DailyAI: 'Mastering AI Tools: Seu guia 2024 para aumentar a produtividade'.

*Ao subscrever a nossa newsletter, aceita a nossa Política de privacidade e o nosso Termos e condições