Os investigadores da empresa de investigação na área da saúde Klick Labs desenvolveram um modelo de aprendizagem automática que pode determinar a presença de diabetes tipo 2 a partir de uma breve gravação de voz de apenas 6 a 10 segundos.
O modelo apresenta uma taxa máxima de exatidão do teste de 89% para as mulheres e de 86% para os homens quando combinado com outras métricas como o índice de massa corporal (IMC).
"A nossa investigação destaca variações vocais significativas entre indivíduos com e sem diabetes de tipo 2 e pode transformar a forma como a comunidade médica faz o rastreio da diabetes", comentou Jaycee Kaufman, investigadora da Klick Labs.
O método, publicado em Mayo Clinic Proceedingsrequer um pequeno clip áudio gravado com um smartphone.
"Os métodos actuais de deteção podem exigir muito tempo, deslocações e custos. A tecnologia de voz tem o potencial de eliminar totalmente estas barreiras", acrescentou Kaufman.
O estudo envolveu a análise de 18.000 gravações, com o objetivo de identificar características acústicas únicas que distinguem os indivíduos diabéticos dos não diabéticos, detectando diferenças subtis de tom e intensidade imperceptíveis ao ouvido humano.
A diabetes em fase avançada ou tardia pode ter impacto na voz ao causar danos nos nervos e prejudicar o fluxo sanguíneo, levando a condições como a neuropatia que afecta as cordas vocais. Isto pode resultar numa voz fraca, rouca ou cansada.
Além disso, a diabetes pode levar à secura da boca devido à redução da produção de saliva, contribuindo ainda mais para os problemas de voz.
Salientando o papel crescente da IA nos cuidados de saúde, os investigadores acreditam que esta tecnologia de voz pode ser alargada ao diagnóstico de outras condições de saúde.
Yan Fossat, vice-presidente da Klick Labs, partilhou: "A nossa investigação sublinha o enorme potencial da tecnologia de voz na identificação da diabetes tipo 2 e de outros problemas de saúde. A tecnologia de voz pode revolucionar as práticas de cuidados de saúde como uma ferramenta de rastreio digital acessível e económica."
Mais informações sobre o estudo
Este é um estudo fascinante, mas será que é metodologicamente robusto?
O tamanho da amostra é relativamente pequeno e há pouca informação sobre o grau de avanço da diabetes no grupo de diabéticos e pouca informação sobre o grupo de controlo.
No entanto, a previsão das qualidades tonais subtis da fala em diabéticos parece certamente possível para aqueles com formas avançadas ou não controladas da doença.
Aqui está um olhar mais atento:
- Objetivo: O estudo tenta investigar se a análise da voz pode ajudar a pré-selecionar ou monitorizar a diabetes mellitus tipo 2 (T2DM). Os investigadores concentraram-se em identificar diferenças nas gravações de voz entre indivíduos com e sem DM2.
- Metodologia: 267 participantes, homens e mulheres, incluindo indivíduos não diabéticos e com DM2, gravaram uma frase fixa várias vezes ao dia durante duas semanas, utilizando uma aplicação para smartphone. Este processo gerou mais de 18.000 gravações. A equipa extraiu 14 características acústicas diferentes destas gravações para analisar e comparar as vozes dos participantes não diabéticos e com DMT2.
- Conclusões: Os investigadores descobriram diferenças significativas nas gravações de voz de homens e mulheres quando compararam os participantes não diabéticos com os participantes com DM2. Identificaram características de voz específicas que previam com exatidão o estado de T2DM, particularmente quando as combinavam com dados de idade e IMC. A precisão máxima do teste atingiu 89% para as mulheres e 86% para os homens.
- Implicações: Estes resultados indicam que a análise da voz tem potencial como ferramenta de pré-seleção ou de monitorização da DMT2. Este método pode ser especialmente útil em comunidades remotas, proporcionando uma opção acessível e não invasiva para a deteção precoce e a monitorização contínua.
O conceito de diagnosticar uma doença através de uma gravação de voz pode parecer rebuscado, e é essencial reconhecer que os melhores resultados só foram obtidos quando as gravações foram combinadas com o IMC.