Des chercheurs de Mount Sinai ont utilisé l'apprentissage automatique pour développer un nouveau modèle d'analyse de l'électrocardiogramme (ECG) appelé HeartBEiT.
HeartBEiT a été pré-entraîné sur un ensemble de données colossal de 8,5 millions d'ECG provenant de 2,1 millions de patients et a surpassé les réseaux neuronaux convolutionnels classiques (CNN).
Les ECG sont des tests de diagnostic cardiaque omniprésents, et quelque 100 millions d'entre eux sont effectués chaque année rien qu'aux États-Unis.
L'ECG mesure l'activité électrique du cœur et est très révélateur d'un grand nombre de troubles du rythme, d'une activité cardiaque anormale associée à des crises cardiaques et d'autres formes de maladies cardiaques. Le problème avec les ECG est que de nombreuses indications plus subtiles sont difficiles à interpréter, en particulier pour les maladies cardiaques rares.
Avant cette étude, l'apprentissage automatique avait déjà été appliqué aux images ECG pour signaler et classer automatiquement les résultats anormaux. Cela augmente la rapidité et la précision du diagnostic et réduit le risque d'oubli clinique.
Mount Sinai, un hôpital et un réseau de recherche de New York, a entraîné un modèle de transformateur basé sur la vision sur 8,5 millions de scans ECG.
Le modèle diffère notamment des réseaux neuronaux convolutionnels (CNN), les réseaux neuronaux les plus courants pour les tâches de classification d'images. Les étudepubliée dans Nature, indique que le modèle a été plus performant que d'autres modèles pour l'identification de diverses affections cardiaques.
Comment fonctionne HeartBEiT
Les CNN pour la classification d'images impliquent un apprentissage automatique supervisé, ce qui signifie qu'ils nécessitent de grandes quantités de données étiquetées, dont la collecte et l'annotation peuvent demander beaucoup de travail. À l'inverse, HeartBEiT utilise des techniques non supervisées pour apprendre à partir d'un vaste ensemble de données, fournissant ainsi une base pour l'adaptation en aval à des tâches plus spécifiques.
L'équipe de recherche a utilisé le modèle DALL-E, créé par OpenAI. DALL-E apprend les relations entre les éléments. Dans ce cas, les parties des images ECG - les "tokens" - sont largement analogues aux mots d'une phrase.
Le modèle apprend leur relation mutuelle, ce qui lui permet de distinguer les jetons anormaux qui indiquent des problèmes cardiaques.
Les prédictions de HeartBEiT ont été comparées aux architectures CNN standard pour plusieurs pathologies cardiaques, en les surpassant sur des échantillons de plus petite taille.
L'un des auteurs, Akhil Vaid, instructeur de la médecine numérique et fondée sur les données (D3M) à l'école de médecine Icahn de Mount Sinai, dit: "Notre modèle a constamment surpassé les réseaux neuronaux convolutionnels [CNN], qui sont des algorithmes d'apprentissage automatique couramment utilisés pour les tâches de vision par ordinateur."
En outre, HeartBEiT a pu mettre en évidence la région spécifique de l'ECG associée à l'anomalie.
Un autre auteur, Girish Nadkarni, MD, MPH, directeur de l'Institut Charles Bronfman de médecine personnalisée, a déclaré : "Les réseaux neuronaux sont considérés comme des boîtes noires, mais notre modèle était beaucoup plus spécifique en mettant en évidence la région de l'ECG responsable d'un diagnostic, tel qu'une crise cardiaque, ce qui aide les cliniciens à mieux comprendre la pathologie sous-jacente."
"En comparaison, les explications de CNN étaient vagues, même lorsqu'elles identifiaient correctement un diagnostic.
Le rôle de l'IA dans la recherche et le développement médicaux est bien établi, et il s'agit là d'un autre exemple de réaffectation innovante de modèles d'apprentissage machine (ML) à des applications médicales.