Inom den krävande experimentella fysiken hjälper maskininlärningstekniken (ML) forskare att analysera enorma men knapphändiga datamängder.
Tänk dig uppgiften att extrahera information från en bok med tusen sidor, där varje sida bara innehåller en rad text. Att skanna en sådan bok med en skanner som metodiskt läser varje sida tum för tum skulle vara oerhört mödosamt och det mesta av arbetet skulle gå åt till att skanna tomma ytor.
Liknande gäller för experimentella fysiker, särskilt inom partikelfysiken. Här registrerar och analyserar detektorer en överväldigande mängd data, trots att bara en liten del av dem är användbara.
Kazuhiro Terao, fysiker vid SLAC National Accelerator Laboratory, beskriver det så här: "På ett fotografi av till exempel en fågel som flyger på himlen kan varje pixel vara meningsfull", men på de bilder som fysiker ofta granskar är det bara en liten del som verkligen betyder något. Detta arbetsintensiva arbete slösar bort både tid och beräkningsresurser.
ML erbjuder en lösning i form av SCNN (sparse convolutional neural networks).
Genom att göra det möjligt för forskare att zooma in på de viktiga delarna av sina data och filtrera bort resten, påskyndar SCNN dataanalys i realtid.
År 2012 försökte Benjamin Graham, som då var verksam vid University of Warwick, skapa ett neuralt nätverk för att känna igen kinesisk handstil. Han justerade convolutional neural networks (CNN), en referensform av neurala nätverk, för att göra dem mer lämpade för data som anses vara "glesa", som en bild av ett kinesiskt tecken.
Graham erbjuder en annan analogi för glesa data: tänk dig att Eiffeltornet var inneslutet i den minsta möjliga rektangeln, den rektangeln skulle vara "99,98 procent luft och bara 0,02 procent järn".
Om du bara bryr dig om metallen analyserar du en enorm mängd värdelöst utrymme.
Tillkomsten av SCNN
Efter att ha lyckats skapa ett system som effektivt kunde känna igen handskriven kinesiska gick Graham vidare till en större utmaning: att känna igen 3D-objekt.
Han förfinade sin teknik och publicerade detaljerna i den första SCNN under 2017 på Facebook AI Research.
Terao introducerade detta koncept till partikelfysik vid Fermi National Accelerator Laboratory, som undersöker neutriner (de mest svårfångade och rikligt förekommande partiklarna med massa i universum).
Terao insåg att SCNN kunde optimera dataanalysen för Deep Underground Neutrino Experiment (DUNE), där han noterade att SCNN bearbetade data snabbare och mer effektivt än traditionella metoder.
Utöver neutrinoforskningen planerar fysikern Philip Harris vid Massachusetts Institute of Technology att använda SCNN vid Large Hadron Collider (LHC) vid CERN.
Harris hoppas att SCNN kan påskynda dataanalysen vid LHC med minst en faktor 50 och bidra till att upptäcka partiklar av särskilt intresse.