Un système d'intelligence artificielle développé à partir de données personnelles complètes provenant du Danemark a fait preuve d'une précision remarquable pour prédire le risque de décès d'une personne.
Cette IA, documentée dans un étude publiée dans Nature Computational Sciencea été créé par Sune Lehmann Jørgensen et son équipe de l'Université technique du Danemark.
Ils ont analysé un vaste ensemble de données regroupant de nombreux facteurs de la population danoise, notamment des données sur l'éducation, les visites médicales, les diagnostics, les revenus et les professions, pour six millions de personnes entre 2008 et 2020.
Ces données ont ensuite été transformées en un format adapté à la formation d'un grand modèle linguistique (LLM). TLe modèle Life2vec de l'équipe passe en revue les événements de la vie d'une personne et prévoit les résultats futurs probables, de la même manière qu'un LLM traite la langue.
Pour tester Life2vec, l'équipe a réservé les quatre dernières années de données et s'est concentrée sur les personnes âgées de 35 à 65 ans, dont la moitié est décédée entre 2016 et 2020.
Les prédictions de Life2vec sur les personnes susceptibles de survivre ou non ont dépassé d'environ 11% les modèles d'IA existants et les tables de mortalité actuarielles (utilisées par le secteur de l'assurance). Life2vec a également été utilisé pour prédire les résultats en matière de personnalité, démontrant ainsi la capacité du modèle à mettre en correspondance les données sociétales à grande échelle et les résultats au niveau individuel.
M. Jørgensen envisage ce modèle comme un outil de détection précoce des problèmes sanitaires et sociaux, susceptible d'aider les gouvernements à réduire les inégalités sanitaires et sociales. Il met en évidence les relations entre la mortalité et l'économie, le travail, le niveau de revenu et l'année de naissance, offrant ainsi une autre possibilité d'explorer l'impact de ces types de facteurs macro-démographiques sur la santé d'un individu.
Toutefois, M. Jørgensen met en garde contre une éventuelle utilisation abusive, en particulier dans le secteur de l'assurance, où elle pourrait perturber le principe fondamental du partage des risques.
Si les assureurs utilisaient l'IA pour déterminer à quel moment une personne donnée court un plus grand risque de décès, cela ouvrirait un débat éthique complexe. Cette situation s'apparente quelque peu aux autres utilisations prédictives de l'IA, telles que l'analyse des risques et l'évaluation de la qualité de vie. programmes de police prédictivequi ont permis de désigner des individus comme "suspects" potentiels avant qu'ils ne commettent un éventuel délit.
Jørgensen a déclaré à ce sujetIl est clair que notre modèle ne devrait pas être utilisé par une compagnie d'assurance, car l'idée même de l'assurance est qu'en partageant le manque de connaissance de la personne malchanceuse frappée par un incident, un décès ou la perte de son sac à dos, nous pouvons en quelque sorte partager ce fardeau".
En savoir plus sur l'étude
Voici quelques informations supplémentaires sur les objectifs de l'étude, son approche novatrice et son fonctionnement :
- Collecte et transformation des données: L'équipe de recherche a rassemblé un vaste ensemble de données couvrant l'ensemble de la population du Danemark, de 2008 à 2016, et comprenant environ six millions d'habitants. Cet ensemble de données comprenait des enregistrements quotidiens détaillés de divers événements de la vie, y compris des incidents de santé, le niveau d'éducation, le statut professionnel, les niveaux de revenus, la résidence et les heures de travail.
- Créer un langage synthétique pour les événements de la vie: Les chercheurs ont converti ces événements de la vie en un format ressemblant à un langage, permettant l'utilisation de techniques de traitement du langage naturel. Ils ont traité chaque événement de la vie comme une "phrase" composée de "jetons conceptuels", qui comprenaient des informations détaillées telles que le type d'événement, le niveau de revenu et le type d'emploi.
- Développement du modèle Life2vec: L'équipe a développé le modèle en utilisant l'architecture du transformateur. Ce modèle peut saisir les relations complexes entre les différents événements de la vie, de la même manière que les LLM comprennent les relations entre les mots.
- Analyse et essais prédictifs: Life2vec a été testé pour sa capacité à prédire divers résultats, notamment la mortalité précoce et les traits de personnalité. Pour la prédiction de la mortalité, le modèle a évalué la probabilité que les individus survivent quatre ans après 2016. Il s'est avéré plus performant que les modèles traditionnels.
- Comprendre et interpréter le modèle: Les chercheurs ont utilisé des méthodes telles que les vecteurs d'activation des concepts (TCAV) pour interpréter les prédictions du modèle. Il s'agissait d'identifier les directions de la vie correspondant à différents résultats ou traits de la vie. En analysant ces directions, ils ont pu comprendre comment des facteurs tels que la situation professionnelle ou les diagnostics de santé influençaient les prédictions du modèle.
L'utilisation de l'IA pour prédire les événements importants de la vie, la mort étant sans aucun doute l'un des plus significatifs, est une perspective alléchante.
Bien que ses avantages et ses risques soient étroitement équilibrés, des applications similaires ont été utilisées à des fins positives. prédire le suicide et l'automutilation chez les adolescents. Dans le domaine des soins de santé en général, la modélisation prédictive permet de hiérarchiser les traitements pour les groupes à risque.
Toutefois, comme le concède M. Jørgensen, il reste du travail à faire pour protéger les utilisations éthiques de ces technologies.