В сложной области экспериментальной физики технологии машинного обучения (ML) помогают исследователям анализировать огромные, но скудные массивы данных.
Представьте себе задачу извлечения информации из книги, состоящей из тысячи страниц, каждая из которых содержит всего одну строку текста. Сканирование такой книги с помощью сканера, который методично считывает каждую страницу дюйм за дюймом, будет чрезвычайно трудоемким, причем большая часть усилий будет потрачена на сканирование пустого пространства.
То же самое относится и к физикам-экспериментаторам, особенно к физике частиц. Здесь детекторы регистрируют и анализируют огромное количество данных, хотя полезным оказывается лишь ничтожный процент.
Казухиро Терао, физик из Национальной ускорительной лаборатории SLAC, говорит: "На фотографии, скажем, птицы, летящей в небе, каждый пиксель может иметь значение", но на изображениях, которые часто тщательно изучают физики, лишь небольшая часть имеет значение. Это трудоемкое занятие приводит к потере времени и вычислительных ресурсов.
ML предлагает решение в виде разреженных конволюционных нейронных сетей (SCNN).
Позволяя исследователям увеличивать масштаб значимых частей данных и отсеивать остальные, SCNN ускоряют анализ данных в режиме реального времени.
В 2012 году Бенджамин Грэм, работавший в то время в Уорикском университете, задался целью создать нейронную сеть для распознавания китайского почерка. Он скорректировал конволюционные нейронные сети (CNN) - эталонный вид нейронных сетей - так, чтобы они лучше подходили для данных, которые считаются "разреженными", например для изображения китайского иероглифа.
Грэм предлагает еще одну аналогию с разреженными данными: представьте, что Эйфелева башня заключена в минимально возможный прямоугольник, и этот прямоугольник "на 99,98 процента состоит из воздуха и всего на 0,02 процента из железа".
Если вас интересует только металл, вы анализируете огромное количество бесполезного пространства.
Появление SCNN
После успешного создания системы, способной эффективно распознавать рукописный китайский язык, Грэм перешел к более серьезной задаче: распознаванию 3D-объектов.
Он усовершенствовал свою технику и опубликовал детали первого SCNN в 2017 году во время работы в Facebook AI Research.
Терао представил это концепция физики частиц в Национальной ускорительной лаборатории Ферми, которая занимается исследованием нейтрино (самых неуловимых и самых распространенных частиц с массой во Вселенной).
Терао признал, что SCNN могут оптимизировать анализ данных для эксперимента Deep Underground Neutrino Experiment (DUNE), где он отметил, что SCNN обрабатывали данные быстрее и эффективнее, чем традиционные методы.
Не ограничиваясь исследованиями нейтрино, физик Филип Харрис из Массачусетского технологического института планирует применить SCNN в Большом адронном коллайдере (БАК) в ЦЕРНе.
Харрис надеется, что SCNN смогут ускорить анализ данных на БАК по крайней мере в 50 раз, способствуя открытию частиц, представляющих особый интерес.