Een nieuw onderzoek toont aan dat mensen moeite hebben om menselijke stemmen van AI-stemmen te onderscheiden, maar dat onze hersenen anders reageren als we ze horen.
Als AI stem klonen steeds geavanceerder wordt, leidt dit tot ethische en veiligheidsproblemen waar mensen vroeger niet mee te maken hadden.
Is de stem aan de andere kant van het telefoongesprek van een mens of is deze gegenereerd door AI? Denk je dat je het zou kunnen zien?
Onderzoekers van de afdeling Psychologie van de Universiteit van Oslo testten 43 mensen om te zien of ze menselijke stemmen konden onderscheiden van stemmen die door AI waren gegenereerd.
De deelnemers waren even slecht in het correct identificeren van menselijke stemmen (56% nauwkeurigheid) en AI-gegenereerde stemmen (50,5% nauwkeurigheid).
De emotie van de stem beïnvloedde hoe waarschijnlijk het was dat ze de stem correct konden identificeren. Neutrale AI-stemmen werden geïdentificeerd met een nauwkeurigheid van 74,9% vergeleken met een nauwkeurigheid van slechts 23% voor neutrale menselijke stemmen.
Gelukkige menselijke stemmen werden 77% van de tijd correct geïdentificeerd, terwijl gelukkige AI-stemmen werden geïdentificeerd met een zorgwekkend lage nauwkeurigheid van 34,5%.
Dus als we een door AI gegenereerde stem horen die blij klinkt, zullen we eerder aannemen dat het een menselijke stem is.
Hoewel we bewust moeite hebben om een AI-stem correct te identificeren, lijken onze hersenen de verschillen op een onbewust niveau op te pikken.
De onderzoekers maakten fMRI-scans van de hersenen van de deelnemers terwijl ze naar de verschillende stemmen luisterden. De scans toonden significante verschillen in hersenactiviteit als reactie op de AI- en menselijke stemmen.
De onderzoekers merkten op: "AI-stemmen activeerden de rechter anterior midcingulate cortex, de rechter dorsolaterale prefrontale cortex en de linker thalamus, wat kan duiden op verhoogde waakzaamheid en cognitieve regulatie.
"Menselijke stemmen wekten daarentegen sterkere reacties op in de rechter hippocampus en in gebieden die geassocieerd worden met emotionele verwerking en empathie, zoals de rechter inferieure frontale gyrus, anterieure cingulate cortex en angulaire gyrus."
We vinden het misschien moeilijk om te weten of een stem door AI is gegenereerd of menselijk is, maar onze hersenen lijken het verschil te kunnen horen. Ze reageren met verhoogde alertheid op AI-stemmen en een gevoel van verwantschap wanneer ze naar een menselijke stem luisteren.
De deelnemers beoordeelden menselijke stemmen als natuurlijker, betrouwbaarder en authentieker, vooral de vrolijke stemmen en plezierige uitdrukkingen.
Doctoraal onderzoeker Christine Skjegstad, die het onderzoek samen met professor Sascha Frühholz uitvoerde, zei: "We weten al dat AI-gegenereerde stemmen zo geavanceerd zijn dat ze bijna niet meer te onderscheiden zijn van echte menselijke stemmen.
"Het is nu mogelijk om de stem van een persoon te klonen op basis van slechts een paar seconden opname en oplichters hebben deze technologie gebruikt om een geliefde in nood na te bootsen en slachtoffers te verleiden om geld over te maken.
"Terwijl experts op het gebied van machine learning technologische oplossingen hebben ontwikkeld om AI-stemmen te detecteren, is er veel minder bekend over de reactie van het menselijk brein op deze stemmen."
Dit onderzoek geeft aan dat onze hersenen aanvoelen dat er iets niet helemaal klopt wanneer ze een synthetische stem verwerken en dan voorzichtiger worden.
We hebben misschien iets meer hulp nodig dan dat als AI-gegenereerde stemmen 'menselijker' worden.