Et AI-system udviklet ved hjælp af omfattende persondata fra Danmark har vist en bemærkelsesværdig nøjagtighed i forudsigelsen af en persons risiko for at dø.
Denne AI, dokumenteret i en undersøgelse offentliggjort i Nature Computational Scienceblev skabt af Sune Lehmann Jørgensen og hans team fra Danmarks Tekniske Universitet.
De analyserede et stort datasæt, der indkapslede adskillige faktorer fra hele den danske befolkning, herunder uddannelse, lægebesøg, diagnoser, indkomst og erhvervsdata, fra seks millioner individer, der strakte sig fra 2008 til 2020.
Disse data blev derefter omdannet til et format, der var egnet til at træne en stor sprogmodel (LLM). Teamets Life2vec-model gennemgår en persons livsbegivenheder og forudsiger sandsynlige fremtidige resultater, på samme måde som en LLM behandler sprog.
For at teste Life2vec reserverede teamet de sidste fire års data og fokuserede på personer i alderen 35 til 65 år, hvoraf halvdelen døde mellem 2016 og 2020.
Life2vecs forudsigelser af, hvem der sandsynligvis ville overleve eller ej, overgik alle eksisterende AI-modeller og aktuarmæssige livstabeller (der bruges af forsikringsbranchen) med ca. 11%. Den blev også brugt til at forudsige personlighedsresultater, hvilket viser modellens evne til at kortlægge samfundsmæssige input i stor skala til output på individniveau.
Jørgensen forestiller sig denne model som et værktøj til tidlig opdagelse af sundhedsmæssige og sociale problemer, der potentielt kan hjælpe regeringer med at reducere sundhedsmæssige og sociale uligheder. Den afdækker sammenhænge mellem dødelighed og økonomi, arbejde, indkomstniveau og fødselsår, hvilket giver en anden mulighed for at udforske indvirkningen af disse typer makrodemografiske faktorer på en persons sundhed.
Jørgensen advarer dog mod potentielt forretningsmæssigt misbrug, især i forsikringsbranchen, hvor det kan forstyrre det grundlæggende princip om delt risiko.
Hvis forsikringsselskaberne brugte AI til at afgøre, hvornår en bestemt person er i større risiko for at dø, ville det åbne op for en kompleks etisk debat. Det svarer lidt til AI's andre forudsigende anvendelser, som f.eks. Prædiktive politiprogrammersom har udpeget personer som potentielle 'mistænkte', før de har begået en mulig forbrydelse.
Jørgensen sagde om dette"Det er klart, at vores model ikke bør bruges af et forsikringsselskab, for hele ideen med forsikring er, at vi ved at dele den manglende viden om, hvem der vil være den uheldige person, der bliver ramt af en hændelse eller død eller mister sin rygsæk, på en måde kan dele denne byrde."
Mere om undersøgelsen
Her er lidt mere information om undersøgelsens mål, nye tilgang og hvordan den fungerede:
- Dataindsamling og -transformation: Forskerteamet indsamlede et omfattende datasæt, der dækkede hele Danmarks befolkning fra 2008 til 2016 og omfattede omkring seks millioner indbyggere. Dette datasæt indeholdt detaljerede daglige registreringer af forskellige livsbegivenheder, herunder sundhedshændelser, uddannelsesniveau, beskæftigelsesstatus, indkomstniveauer, bopæl og arbejdstid.
- At skabe et syntetisk sprog for livsbegivenheder: Forskerne konverterede disse livsbegivenheder til et format, der lignede sprog, hvilket gjorde det muligt at bruge teknikker til behandling af naturligt sprog. De behandlede hver livsbegivenhed som en 'sætning' bestående af 'koncept-tokens', som indeholdt detaljerede oplysninger som typen af begivenhed, indkomstniveau og jobtype.
- Udvikling af Life2vec-modellen: Ved hjælp af transformerarkitektur udviklede teamet modellen. Denne model kunne indfange komplekse relationer mellem forskellige livsbegivenheder, på samme måde som LLM'er forstår relationer mellem ord.
- Forudsigende analyse og testning: Life2vec blev testet for sin evne til at forudsige forskellige resultater, især tidlig dødelighed og personlighedstræk. Til forudsigelse af dødelighed evaluerede modellen sandsynligheden for, at personer overlevede fire år efter 2016. Den klarede sig bedre end traditionelle modeller.
- Forståelse og fortolkning af modellen: Forskerne brugte metoder som begrebsaktiveringsvektorer (TCAV) til at fortolke modellens forudsigelser. Det indebar at identificere livsretninger, der svarer til forskellige livsudfald eller træk. Ved at analysere disse retninger fik de indsigt i, hvordan faktorer som f.eks. beskæftigelsesstatus eller sundhedsdiagnoser påvirkede modellens forudsigelser.
At bruge AI til at forudsige vigtige livsbegivenheder, hvor døden utvivlsomt er en af de mest betydningsfulde, er et spændende perspektiv.
Mens fordele og risici er nøje afbalancerede, er lignende applikationer blevet kanaliseret til et positivt formål, som denne model, der bruges til at forudsige unges selvmord og selvskade. I sundhedsvæsenet generelt hjælper prædiktiv modellering med at prioritere behandlinger for risikogrupper.
Men som Jørgensen indrømmer, skal der gøres en indsats for at beskytte den etiske brug af disse teknologier.