Um novo estudo mostra que, embora os humanos tenham dificuldade em distinguir as vozes humanas das vozes da IA, os nossos cérebros reagem de forma diferente quando as ouvimos.
Como IA clonagem de voz se torna mais avançado, suscita preocupações éticas e de segurança a que os humanos não estavam expostos anteriormente.
A voz do outro lado da chamada telefónica pertence a um humano ou foi gerada pela IA? Achas que consegues perceber?
Os investigadores do Departamento de Psicologia da Universidade de Oslo testaram 43 pessoas para ver se conseguiam distinguir as vozes humanas das vozes geradas por IA.
Os participantes foram igualmente maus a identificar corretamente as vozes humanas (precisão de 56%) e as vozes geradas por IA (precisão de 50,5%).
A emoção da voz afectou a probabilidade de a identificarem corretamente. As vozes neutras da IA foram identificadas com uma precisão de 74,9%, em comparação com apenas 23% de precisão para as vozes humanas neutras.
As vozes humanas felizes foram corretamente identificadas em 77% das vezes, enquanto as vozes felizes da IA foram identificadas com uma precisão preocupantemente baixa de 34,5%.
Assim, se ouvirmos uma voz gerada por uma IA que pareça feliz, é mais provável que assumamos que é humana.
Embora conscientemente nos esforcemos por identificar corretamente uma voz de IA, o nosso cérebro parece captar as diferenças a um nível subconsciente.
Os investigadores efectuaram exames de fMRI aos cérebros dos participantes enquanto estes ouviam as diferentes vozes. Os exames revelaram diferenças significativas na atividade cerebral em resposta à IA e às vozes humanas.
Os investigadores observaram que "as vozes de IA activaram o córtex mediano anterior direito, o córtex pré-frontal dorsolateral direito e o tálamo esquerdo, o que pode indicar um aumento da vigilância e da regulação cognitiva.
"Em contrapartida, as vozes humanas provocaram respostas mais fortes no hipocampo direito, bem como em regiões associadas ao processamento emocional e à empatia, como o giro frontal inferior direito, o córtex cingulado anterior e o giro angular."
Podemos ter dificuldade em saber se uma voz é gerada por IA ou humana, mas o nosso cérebro parece ser capaz de distinguir. O nosso cérebro parece ser capaz de distinguir entre uma voz gerada por IA e uma voz humana.
Os participantes classificaram as vozes humanas como mais naturais, fiáveis e autênticas, especialmente as vozes felizes e as expressões de prazer.
A investigadora de doutoramento Christine Skjegstad, que conduziu o estudo juntamente com o Professor Sascha Frühholz, afirmou: "Já sabemos que as vozes geradas por IA se tornaram tão avançadas que são quase indistinguíveis das vozes humanas reais.
"É agora possível clonar a voz de uma pessoa a partir de apenas alguns segundos de gravação, e os burlões têm utilizado esta tecnologia para imitar um ente querido em perigo e enganar as vítimas para que transfiram dinheiro.
"Enquanto os especialistas em aprendizagem automática têm vindo a desenvolver soluções tecnológicas para detetar vozes de IA, sabe-se muito menos sobre a resposta do cérebro humano a essas vozes."
Esta investigação indica que o nosso cérebro sente que algo não está bem quando processa uma voz sintética e torna-se mais cauteloso.
Poderemos precisar de um pouco mais de ajuda à medida que as vozes geradas pela IA se tornam mais "humanas".