Um sistema de IA desenvolvido com base em dados pessoais abrangentes da Dinamarca demonstrou uma precisão notável na previsão do risco de morte de um indivíduo.
Esta IA, documentada numa estudo publicado na revista Nature Computational Sciencefoi criado por Sune Lehmann Jørgensen e pela sua equipa da Universidade Técnica da Dinamarca.
Analisaram um enorme conjunto de dados que engloba numerosos factores da população dinamarquesa, incluindo dados sobre educação, consultas médicas, diagnósticos, rendimentos e profissão, de seis milhões de indivíduos, entre 2008 e 2020.
Estes dados foram depois transformados num formato adequado para treinar um modelo de linguagem de grande dimensão (LLM). TO modelo Life2vec da equipa analisa os acontecimentos da vida de uma pessoa e prevê prováveis resultados futuros, à semelhança da forma como um LLM processa a linguagem.
Para testar o Life2vec, a equipa reservou os últimos quatro anos de dados e centrou-se em indivíduos com idades compreendidas entre os 35 e os 65 anos, metade dos quais faleceu entre 2016 e 2020.
As previsões do Life2vec sobre a probabilidade de sobrevivência ou não de um indivíduo superaram os modelos de IA existentes e as tabelas actuariais de vida (utilizadas pelo sector dos seguros) em cerca de 11%. Também foi utilizado para prever resultados de personalidade, demonstrando a capacidade do modelo para mapear entradas sociais em grande escala para saídas a nível individual.
Jørgensen encara este modelo como uma ferramenta para a deteção precoce de problemas sociais e de saúde, potencialmente ajudando os governos a reduzir as desigualdades sociais e de saúde. Revela relações entre a mortalidade e a economia, o trabalho, o nível de rendimento e o ano de nascimento, proporcionando outra via para explorar o impacto destes tipos de factores macro-demográficos na saúde de um indivíduo.
No entanto, Jørgensen adverte para a possibilidade de uma utilização abusiva, nomeadamente no sector dos seguros, que poderia perturbar o princípio fundamental da partilha de riscos.
Se as seguradoras utilizassem a IA para determinar quando é que um indivíduo específico está em maior risco de morte, isso abriria um debate ético complexo. Isto é um pouco semelhante a outras utilizações preditivas da IA, tais como programas de policiamento preditivoque identificaram indivíduos como potenciais "suspeitos" antes de terem cometido um eventual crime.
Jørgensen referiu-se a este facto"É evidente que o nosso modelo não deve ser utilizado por uma companhia de seguros, porque toda a ideia de seguro é que, ao partilhar a falta de conhecimento de quem vai ser a pessoa azarada atingida por algum incidente, ou a morte, ou a perda da mochila, podemos partilhar este fardo".
Mais informações sobre o estudo
Eis mais algumas informações sobre os objectivos do estudo, a nova abordagem e o seu funcionamento:
- Recolha e transformação de dados: A equipa de investigação reuniu um vasto conjunto de dados que abrange toda a população da Dinamarca, de 2008 a 2016, incluindo cerca de seis milhões de habitantes. Este conjunto de dados incluía registos diários detalhados de vários acontecimentos da vida, incluindo incidentes de saúde, nível de educação, estatuto profissional, níveis de rendimento, residência e horas de trabalho.
- Criar uma linguagem sintética para os acontecimentos da vida: Os investigadores converteram estes acontecimentos da vida num formato semelhante a uma linguagem, permitindo a utilização de técnicas de processamento de linguagem natural. Trataram cada acontecimento da vida como uma "frase" constituída por "tokens de conceito", que incluíam informações pormenorizadas como o tipo de acontecimento, o nível de rendimento e o tipo de emprego.
- Desenvolvimento do modelo Life2vec: Utilizando a arquitetura de transformação, a equipa desenvolveu o modelo. Este modelo pode captar relações complexas entre diferentes eventos da vida, à semelhança da forma como os LLMs compreendem as relações entre palavras.
- Análise e testes preditivos: O Life2vec foi testado quanto à sua capacidade de prever vários resultados, nomeadamente a mortalidade precoce e os traços de personalidade. Relativamente à previsão da mortalidade, o modelo avaliou a probabilidade de os indivíduos sobreviverem quatro anos após 2016. O modelo superou os modelos tradicionais ao fazê-lo.
- Compreender e interpretar o modelo: Os investigadores utilizaram métodos como os vectores de ativação de conceitos (TCAV) para interpretar as previsões do modelo. Isto envolveu a identificação de direcções de vida correspondentes a diferentes resultados ou traços de vida. Ao analisar estas direcções, obtiveram informações sobre a forma como factores como o estatuto profissional ou os diagnósticos de saúde influenciaram as previsões do modelo.
Utilizar a IA para prever acontecimentos importantes da vida, sendo a morte, sem dúvida, um dos mais significativos, é uma perspetiva tentadora.
Embora os seus benefícios e riscos sejam muito equilibrados, aplicações semelhantes foram canalizadas para um fim positivo, como este modelo utilizado para prever o suicídio e a automutilação na adolescência. Nos cuidados de saúde em geral, a modelação preditiva está a ajudar a dar prioridade aos tratamentos para grupos de risco.
No entanto, como reconhece Jørgensen, há que trabalhar para proteger as utilizações éticas destas tecnologias.