Inden for den krævende eksperimentelle fysik hjælper maskinlæringsteknologi (ML) forskere med at analysere kolossale, men sparsomme datasæt.
Forestil dig opgaven med at udtrække information fra en bog med tusind sider, der hver især kun indeholder én linje tekst. At scanne sådan en bog med en scanner, der metodisk læser hver side tomme for tomme, ville være enormt besværligt, og det meste af arbejdet ville være spildt på at scanne tomrum.
Det samme gælder for eksperimentalfysikere, især inden for partikelfysik. Her registrerer og analyserer detektorerne en overvældende mængde data, selv om kun en lille procentdel er brugbar.
Som Kazuhiro Terao, der er fysiker ved SLAC National Accelerator Laboratory, beskriver det: "På et fotografi af f.eks. en fugl, der flyver på himlen, kan hver eneste pixel være meningsfuld," men på de billeder, som fysikere ofte undersøger, er det kun en lille del, der virkelig betyder noget. Denne arbejdskrævende øvelse spilder både tid og computerressourcer.
ML tilbyder en løsning i form af sparse convolutional neural networks (SCNN).
Ved at gøre det muligt for forskere at zoome ind på de vigtige dele af deres data og filtrere resten fra, fremskynder SCNN'er dataanalyse i realtid.
I 2012 forsøgte Benjamin Graham, som dengang arbejdede på University of Warwick, at skabe et neuralt netværk, som kunne genkende kinesisk håndskrift. Han justerede convolutional neural networks (CNN'er), en referenceform for neurale netværk, for at gøre dem mere egnede til data, der betragtes som 'sparsomme', som et billede af et kinesisk tegn.
Graham tilbyder en anden analogi for sparsomme data: Forestil dig, at Eiffeltårnet var indkapslet i det mindst mulige rektangel, det rektangel ville være "99,98 procent luft og kun 0,02 procent jern".
Hvis du kun er interesseret i metallet, analyserer du en enorm mængde ubrugelig plads.
Fremkomsten af SCNN'er
Efter at have skabt et system, der effektivt kunne genkende håndskrevet kinesisk, gik Graham videre til en større udfordring: at genkende 3D-objekter.
Han forfinede sin teknik og offentliggjorde detaljerne i den første SCNN i 2017 mens han var hos Facebook AI Research.
Terao introducerede dette koncept til partikelfysik på Fermi National Accelerator Laboratory, som undersøger neutrinoer (de mest flygtige og rigelige partikler med masse i universet).
Terao erkendte, at SCNN'er kunne optimere dataanalysen for Deep Underground Neutrino Experiment (DUNE), hvor han bemærkede, at SCNN'erne behandlede dataene hurtigere og mere effektivt end traditionelle metoder.
Ud over neutrinoforskningen planlægger fysikeren Philip Harris fra Massachusetts Institute of Technology at anvende SCNN'er ved Large Hadron Collider (LHC) på CERN.
Harris håber, at SCNN'er kan fremskynde dataanalysen ved LHC med mindst en faktor 50 og bidrage til at opdage partikler af særlig interesse.