No exigente domínio da física experimental, a tecnologia de aprendizagem automática (ML) está a ajudar os investigadores a analisar conjuntos de dados colossais mas escassos.
Imagine a tarefa de extrair informação de um livro com mil páginas, cada uma contendo apenas uma linha de texto. A digitalização desse livro com um scanner que lê metodicamente cada página centímetro a centímetro seria tremendamente trabalhosa, sendo a maior parte do esforço desperdiçado na digitalização de espaços em branco.
O mesmo se aplica aos físicos experimentais, em particular à física de partículas. Aqui, os detectores registam e analisam uma quantidade esmagadora de dados, apesar de apenas uma pequena percentagem ser útil.
Como descreve Kazuhiro Terao, um físico do Laboratório Nacional de Aceleração SLAC, "numa fotografia de, digamos, um pássaro a voar no céu, cada pixel pode ser significativo", mas nas imagens que os físicos analisam frequentemente, apenas uma pequena parte é verdadeiramente importante. Este exercício de trabalho intensivo desperdiça tempo e recursos computacionais.
O ML oferece uma solução sob a forma de redes neurais convolucionais esparsas (SCNN).
Ao permitir que os investigadores se aproximem das partes significativas dos seus dados e filtrem o resto, os SCNNs aceleram a análise de dados em tempo real.
Em 2012, Benjamin Graham, na altura na Universidade de Warwick, tinha como objetivo criar uma rede neural para reconhecer a caligrafia chinesa. Ajustou as redes neurais convolucionais (CNN), uma forma de referência de rede neural, para as tornar mais adequadas a dados considerados "esparsos", como a imagem de um carácter chinês.
Graham oferece outra analogia para os dados esparsos: se a Torre Eiffel fosse encerrada no retângulo mais pequeno possível, esse retângulo seria "99,98% ar e apenas 0,02% ferro".
Se só se preocupa com o metal, está a analisar uma quantidade enorme de espaço inútil.
O advento das SCNNs
Depois de criar com sucesso um sistema capaz de reconhecer eficazmente a escrita à mão em chinês, Graham passou a um desafio maior: reconhecer objectos 3D.
Aperfeiçoou a sua técnica e publicou os pormenores da primeira SCNN em 2017 enquanto esteve no Facebook AI Research.
Terao apresentou este conceito para a física das partículas no Fermi National Accelerator Laboratory, que investiga os neutrinos (as partículas com massa mais esquivas e abundantes do universo).
Terao reconheceu que os SCNNs poderiam otimizar a análise de dados para a Deep Underground Neutrino Experiment (DUNE), onde observou que os SCNNs processavam os dados de forma mais rápida e eficiente do que os métodos tradicionais.
Para além da investigação sobre neutrinos, o físico Philip Harris, do Instituto de Tecnologia de Massachusetts, planeia aplicar as SCNN no Grande Colisor de Hádrons (LHC) do CERN.
Harris espera que as SCNNs possam acelerar a análise de dados no LHC pelo menos por um fator de 50, contribuindo para a descoberta de partículas de especial interesse.