DeepMind anunciado AlphaFold 3, a última iteração do seu projeto de dobragem de proteínas.
AlphaFold 3Tal como os seus antecessores, prevê principalmente a forma como as proteínas se dobram com base nas suas sequências de aminoácidos.
As proteínas, os blocos de construção de toda a vida orgânica, são compostas por longas cadeias de aminoácidos que se dobram como "origami" em estruturas 3D que determinam as suas funções.
A compreensão da forma como estas estruturas se dobram abre a porta à decifração dos mecanismos moleculares que estão na base da saúde e da doença.
Por exemplo, em alguns casos, as proteínas podem ficar mal dobradas, o que perturba a sua função normal e contribui para o desenvolvimento de doenças como a doença de Alzheimer e a doença de Parkinson.
A dobragem incorrecta pode interferir com a saúde celular através da acumulação de proteínas disfuncionais que podem danificar as células e os tecidos.
Ao desvendar os mecanismos subjacentes a este processo, os cientistas podem desenvolver fármacos que eliminem eficazmente as proteínas mal dobradas acumuladas no organismo ou intervenções que impeçam a ocorrência de mal dobradas.
Apresentação do AlphaFold 3
DeepMind recentemente anunciado AlphaFold 3que inclui uma versão melhorada do módulo Evoformer, parte da arquitetura de aprendizagem profunda subjacente ao AlphaFold 2.
Quando o módulo Evoformer processa as moléculas de entrada, o AlphaFold 3 utiliza uma nova rede de difusão para montar as estruturas previstas.
Esta rede é semelhante às utilizadas em geradores de imagens de IA como DALL-E. Começa com uma "nuvem" de átomos e refina iterativamente a estrutura ao longo de uma série de passos até convergir para uma configuração molecular final, provavelmente exacta.
O modelo AlphaFold 3 evoluiu para além das proteínas - também capta as interacções do ADN, ARN e ligandos. Um ligando é uma molécula que se liga a outra molécula, tipicamente uma proteína, para formar um complexo e frequentemente desencadeia uma resposta biológica ou uma alteração na função da proteína.
Laboratórios Isomorphic, que colaborou com DeepMind no projeto AlphaFold 3, já está a trabalhar com empresas farmacêuticas, aplicando o modelo a desafios reais de conceção de medicamentos.
DeepMind lançou também o projeto Servidor AlphaFolduma plataforma gratuita e de fácil utilização que permite aos investigadores tirar partido do poder do AlphaFold 3 sem grandes recursos computacionais ou conhecimentos especializados em aprendizagem automática.
Uma breve história do projeto AlphaFold
Antes da aprendizagem automática, calcular o número de configurações que uma proteína poderia assumir era astronomicamente moroso.
O projeto AlphaFold teve início em 2016 e terminou em 2018, pouco depois da vitória histórica do AlphaGo contra Lee Sedol, um dos melhores jogadores internacionais de Go.
Em 2018, DeepMind estreou o AlphaFold 1, a primeira versão do sistema de IA, na CASP13 (Critical Assessment of Protein Structure Prediction) challenge.
Este concurso bienal reúne grupos de investigação de todo o mundo para testar a exatidão das suas previsões de estruturas proteicas em relação a dados experimentais reais.
O AlphaFold 1 ficou em primeiro lugar no concurso, um marco importante na biologia computacional.
Dois anos mais tarde, na CASP14 em 2020, DeepMind apresentou o AlphaFold 2, demonstrando uma exatidão tão elevada que a comunidade científica considerou o problema da dobragem de proteínas essencialmente resolvido.
O desempenho do AlphaFold 2 foi notável. Atingiu uma pontuação de precisão média de 92,4 GDT (Global Distance Test) em todos os objectivos.
Para colocar isto em perspetiva, uma pontuação de 90 GDT é considerada competitiva com os resultados obtidos através de métodos experimentais. O artigo sobre os métodos do AlphaFold 2 recebeu desde então mais de 20.000 citações, o que o coloca entre os 500 artigos mais citados em todos os domínios científicos.
A AlphaFold tem sido fundamental em numerosos projectos de investigação inovadores, como o estudo de proteínas que podem degradar poluentes ambientais, como os plásticos, e melhorar a nossa compreensão de doenças tropicais pouco comuns, como a leishmaniose e a doença de Chagas.
Em julho de 2021, DeepMindem parceria com o Instituto Europeu de Bioinformática do EMBL (EMBL-EBI), lançou a base de dados de estruturas proteicas AlphaFold, que dá acesso a mais de 350 000 previsões de estruturas proteicas, incluindo o proteoma humano completo.
Desde então, esta base de dados foi alargada para incluir mais de 200 milhões de estruturas, abrangendo quase todas as proteínas catalogadas conhecidas pela ciência.
Até à data, a Base de Dados de Estruturas de Proteínas AlphaFold foi acedida por mais de um milhão de utilizadores em mais de 190 países, permitindo descobertas em áreas que vão desde a medicina à agricultura e muito mais.
O AlphaFold 3 marca mais uma iteração para este sistema de descoberta e análise de proteínas, o melhor da sua classe.