En el exigente ámbito de la física experimental, la tecnología de aprendizaje automático está ayudando a los investigadores a analizar conjuntos de datos colosales pero dispersos.
Imagínese la tarea de extraer información de un libro de mil páginas, cada una de las cuales contiene una sola línea de texto. Escanear un libro así con un escáner que lea metódicamente cada página centímetro a centímetro sería tremendamente laborioso, y la mayor parte del esfuerzo se desperdiciaría escaneando espacios en blanco.
Lo mismo ocurre con los físicos experimentales, especialmente los de partículas. Aquí, los detectores registran y analizan una cantidad abrumadora de datos, a pesar de que sólo un porcentaje ínfimo es útil.
Kazuhiro Terao, físico del SLAC National Accelerator Laboratory, lo describe así: "En una fotografía de, por ejemplo, un pájaro volando en el cielo, cada píxel puede ser significativo", pero en las imágenes que los físicos suelen analizar, sólo una pequeña parte es realmente importante. Este laborioso ejercicio supone un despilfarro de tiempo y recursos informáticos.
ML ofrece una solución en forma de redes neuronales convolucionales dispersas (SCNN).
Al permitir a los investigadores centrarse en las partes significativas de sus datos y filtrar el resto, las SCNN aceleran el análisis de datos en tiempo real.
En 2012, Benjamin Graham, entonces en la Universidad de Warwick, se propuso crear una red neuronal para reconocer la escritura china. Ajustó las redes neuronales convolucionales (CNN), una forma de red neuronal de referencia, para que fueran más adecuadas para datos considerados "dispersos", como la imagen de un carácter chino.
Graham ofrece otra analogía para los datos dispersos: imagine que la Torre Eiffel estuviera encerrada en el rectángulo más pequeño posible, ese rectángulo sería "99,98% aire y sólo 0,02% hierro".
Si sólo te preocupa el metal, estás analizando una enorme cantidad de espacio inútil.
La llegada de las SCNN
Tras crear con éxito un sistema capaz de reconocer eficazmente la escritura a mano en chino, Graham pasó a un reto mayor: el reconocimiento de objetos tridimensionales.
Perfeccionó su técnica y publicó los detalles de la primera SCNN en 2017 mientras trabajaba en Facebook AI Research.
Terao introdujo este concepto a la física de partículas en el Laboratorio Nacional de Aceleradores Fermi, que investiga los neutrinos (las partículas con masa más elusivas y abundantes del universo).
Terao reconoció que las SCNN podían optimizar el análisis de datos para el Experimento de Neutrinos Subterráneos Profundos (DUNE), donde observó que las SCNN procesaban los datos con mayor rapidez y eficacia que los métodos tradicionales.
Más allá de la investigación sobre neutrinos, el físico Philip Harris, del Instituto Tecnológico de Massachusetts, planea aplicar las SCNN en el Gran Colisionador de Hadrones (LHC) del CERN.
Harris espera que las SCNN puedan acelerar el análisis de datos en el LHC en al menos un factor 50, contribuyendo a descubrir partículas de especial interés.