Forskarna fann att människor i allmänhet är dåliga på att identifiera vilka ansikten som är verkliga och vilka som genereras av AI. Hyperrealistiska AI-ansikten bedöms oftare som verkliga än faktiska mänskliga ansikten.
Studiensom leddes av Australian National University, inkluderade experiment för att se om människor kunde skilja mellan mänskliga och AI-genererade ansikten och vilka egenskaper som ledde till de val som människor gjorde.
Tidigare studier visade att deltagarna kunde upptäcka ett icke-vitt AI-ansikte cirka 50% av tiden. I denna nyare studie fick en grupp på 124 vuxna se en blandning av 100 AI och 100 riktiga vita ansikten och ombads identifiera om de var riktiga eller inte.
Den AI-genererade ansikten identifierades felaktigt som mänskliga 65,9% av tiden medan mänskliga ansikten bedömdes som mänskliga endast 51,1% av tiden.
"Artificiell intelligens har nått en häpnadsväckande nivå av realism, och här ser vi att den ibland till och med kan verka mer verklig än verkligheten - hyperrealism - så att vi mycket lätt kan luras att tro att ett AI-genererat ansikte är verkligt", säger Dr. Eva Krumhuber, medförfattare.
Deltagarna tillfrågades också om hur säkra de var på sin bedömning. I ett klassiskt exempel på Dunning-Kruger-effekten var det de deltagare som gjorde flest fel som var mest säkra på att de gjorde korrekta bedömningar.
Elizabeth Miller, medförfattare till studien och doktorand vid Australian National University, säger: "Det är oroande att de personer som oftast trodde att AI-ansiktena var verkliga paradoxalt nog var de som var mest säkra på att deras bedömningar var korrekta."
Hur skulle du ha klarat dig i testet? Vilka av dessa är verkliga och vilka är AI-genererade? Vi berättar hur du klarade dig längre ner.
Forskarna drog slutsatsen att AI-genererade ansikten inte bara är omöjliga att skilja från mänskliga ansikten, utan att de har egenskaper som gör att de verkar ännu mer verkliga för oss. De kallade denna egenskap hos AI-ansikten för hyperrealism.
Forskarna använde StyleGAN2, ett generativt adversarial network (GAN), för att generera AI-ansiktena. StyleGAN2 tränades på ett stort dataset med mänskliga ansikten där cirka 69% var vita och 31% för alla andra raser tillsammans.
Forskarna drog slutsatsen att överrepresentationen av vita ansikten gjorde det möjligt för modellen att generera ansikten som representerade genomsnittet av alla dessa egenskaper på ett sätt som gjorde att de såg mer mänskliga ut än mänskliga.
I rapporten dras slutsatsen att denna skevhet i träningsdataseten väcker viktiga frågor. "Om AI-ansikten verkar mer realistiska för vita ansikten än för andra grupper, kommer deras användning att förvirra uppfattningar om ras med uppfattningar om att vara 'mänsklig'", konstaterades det.
Om en AI-modells uppfattning om ett mänskligt ansikte är ett onaturligt genomsnitt av vita ansiktsdrag, hur skulle den då kunna skilja mellan en riktig människa av olika etnicitet och en AI-imitation om den ombads att göra det?
Seniorförfattaren Dr. Amy Dawel sa: "Om vita AI-ansikten konsekvent uppfattas som mer realistiska kan denna teknik få allvarliga konsekvenser för färgade människor genom att i slutändan förstärka rasistiska fördomar online."
Vilka funktioner ledde till misstagen?
Det måste finnas några specifika egenskaper hos ett AI-ansikt som får oss att tro att det är mer mänskligt än ett riktigt mänskligt ansikte. I det andra experimentet ombads 610 deltagare att betygsätta AI- och människoansiktena utifrån 14 olika attribut, bland annat attraktivitet, ögonkontakt och uttrycksfullhet.
Genom att kombinera dessa data med dem från det första experimentet kunde forskarna identifiera vad som gjorde människor mer benägna att identifiera ett ansikte som AI-genererat eller verkligt.
De fann att hyperrealismen hos AI-ansikten kunde hänföras till att de var "betydligt mer genomsnittliga (mindre distinkta), bekanta och attraktiva och mindre minnesvärda än mänskliga ansikten".
Det faktum att vi är så snabba att acceptera att ett AI-ansikt är äkta visar hur viktigt det är att ha verktyg för att upptäcka AI-fejk.
Forskarna tog data från de mänskligt uppfattade attributen och hur de användes korrekt och felaktigt vid felidentifiering av AI-ansikten och skapade en maskininlärningsmodell för att upptäcka AI-ansikten. Modellen kunde korrekt klassificera ansiktstyp med 94% noggrannhet.
Det är inte troligt att vi kör ett ansikte genom en AI-ansiktskontroll varje gång vi ser ett på nätet. Och ansiktsgeneratorer kommer bara att bli bättre på att slå fejkdetektorerna.
Dr Dawel sammanfattade vad vårt bästa alternativ är inför detta: "Att utbilda människor om den upplevda realismen hos AI-ansikten kan bidra till att allmänheten blir tillräckligt skeptisk till de bilder de ser på nätet."
Om vi påminner oss själva om att vi är riktigt dåliga på att upptäcka förfalskningar, kanske vi blir mindre benägna att låta oss luras av dem.