Falske AI-klonede stemmer kom for nylig i nyhederne på grund af et "Biden"-robotopkald, men almindelige mennesker bliver påvirket, efterhånden som teknologien bliver mere tilgængelig og sværere at opdage.
For to uger siden blev der offentliggjort en lydoptagelse af Pikesville Highs rektor Eric Eiswert, hvor det lød, som om Eiswert kom med racistiske og antisemitiske kommentarer om personale og elever.
Eiswert benægtede ægtheden af lyden, en holdning, der blev støttet af Billy Burke, den administrerende direktør for Council of Administrative and Supervisory Employees, der repræsenterer administratorer i Baltimore County.
"Vi tror, at det er AI-genereret," sagde Burke. "Det sagde han ikke."
I en tid med AI-forfalskninger er "Løgnerens udbytte" giver alle en nem udvej til at råbe "Fake!", når de er i knibe. Samtidig kan AI-stemmekloning forårsage stor skade på almindelige menneskers omdømme som Eiswert.
Hvad synes du om det? Falsk eller ægte?
Se dette opslag på Instagram
Enten er lyden ægte, og han bør fyres, eller også er det en AI-falskneri, og nogen bør sagsøges.
To uger senere kan ingen sige noget, så Eiswerts job og omdømme er stadig i limbo. Det er et bevis på, hvor gode disse stemmekloningsværktøjer er blevet, og de komplekse spørgsmål, teknologien rejser.
For et år siden ville vi måske have afvist Eiswerts påstand om AI-falskneri med den begrundelse, at der ikke fandtes så avanceret AI-teknologi. Nu gør virksomheder som Eleven Labs eller billige værktøjer som Parrot AI det nemt for alle at lave imponerende stemmekloner.
OpenVoice, der udkom tidligere på måneden, bruger kun få sekunders lyd til at klone en stemme og giver mulighed for detaljeret kontrol over følelser, accent, tone, rytme og meget mere.
I dag er vi stolte af at være open source for vores OpenVoice-algoritme og omfavne vores grundlæggende etos - AI for alle.
Oplev det nu: https://t.co/zHJpeVpX3t. Klon stemmer med uovertruffen præcision, med granulær kontrol af tone, fra følelser til accent, rytme, pauser og intonation, ved hjælp af bare en... pic.twitter.com/RwmYajpxOt
- MyShell (@myshell_ai) 2. januar 2024
Hany Farid, professor ved University of California, Berkley, har specialiseret sig i digital kriminalteknik og autentificering af digitale medier. Da en WJZ-reporter bad ham om at analysere klippet, sagde Farid, at det tydeligvis var blevet redigeret, men derudover kunne han ikke bekræfte, om det var autentisk eller ej.
I et interview med Scientific American sagde Farid: "Jeg har analyseret lyden med nogle af vores værktøjer, som endnu ikke er offentligt tilgængelige. Jeg tror, det er sandsynligt - men ikke sikkert - at denne lyd er AI-genereret ... Alt i alt tror jeg, at beviserne peger på, at denne lyd er uægte. Men før vi træffer en endelig beslutning, er vi nødt til at lære mere."
Farid sagde, at der måske var 5 eller færre laboratorier på verdensplan, der med sikkerhed kunne afgøre, om lyden er en AI-falsk eller ægte.
AI-klonen, som Dudesy lavede af George Carlin er et godt eksempel på, hvordan AI-stemmekloning er ved at blive rigtig god til at matche tonefald og følelser. Videoen er siden blevet gjort utilgængelig.
Folkene bag mysentient.ai chatbots har lavet en parodi Debat mellem Trump og Biden. De ting, som 'Trump' og 'Biden' siger, er så skøre, at det tydeligvis er lavet for at få en komisk effekt, men de lyder virkelig godt.
Efterhånden som disse værktøjer bliver bedre og mere frit tilgængelige, vil situationer som den, rektor i Baltimore stod over for, i stigende grad påvirke både politikere og almindelige mennesker.
Hvis du har sendt en WhatsApp-stemmemeddelelse eller lagt en besked på en telefonsvarer, kan du være den næste. Eller hvis nogen har optaget dig og sagt noget akavet, kan du bare sige, at det er en AI-falskneri. Ingen synes at kunne bevise det på nogen måde.