Falske AI-klonede stemmer kom nylig i nyhetene på grunn av en "Biden"-robotoppringning, men vanlige mennesker blir også rammet etter hvert som teknologien blir mer tilgjengelig og vanskeligere å oppdage.
For to uker siden ble det offentliggjort et lydopptak av rektor Eric Eiswert ved Pikesville High, der det hørtes ut som om Eiswert kom med rasistiske og antisemittiske kommentarer om ansatte og elever.
Eiswert benektet at lyden var autentisk, et standpunkt som ble støttet av Billy Burke, administrerende direktør i Council of Administrative and Supervisory Employees, som representerer administratorer i Baltimore County.
"Vi tror at den er generert av kunstig intelligens", sa Burke. "Det sa han ikke."
I en tid med AI-forfalskninger er "Løgnerens utbytte" gir hvem som helst en enkel utvei til å rope "Fake!" når de er i en vanskelig situasjon. Samtidig kan AI-stemmekloning forårsake stor skade på omdømmet til vanlige mennesker som Eiswert.
Hva tror du? Falsk eller ekte?
Se dette innlegget på Instagram
Enten er lyden ekte, og han bør få sparken, eller så er det en AI-falsk, og noen bør saksøkes.
To uker senere kan ingen si noe, så Eiswerts jobb og omdømme er fortsatt i limbo. Det er et bevis på hvor gode disse stemmekloningsverktøyene er blitt, og hvor komplekse spørsmål teknologien reiser.
For et år siden ville vi kanskje avfeid Eiswerts påstand om AI-falskhet med at det ikke fantes så avansert AI-teknologi. Nå gjør selskaper som Eleven Labs eller billige verktøy som Parrot AI det enkelt for hvem som helst å lage imponerende stemmekloner.
OpenVoice, som ble lansert tidligere denne måneden, bruker bare noen sekunder med lyd for å klone en stemme og gir detaljert kontroll over følelser, aksent, tonefall, rytme og mer.
I dag er vi stolte av å ha åpen kildekode for OpenVoice-algoritmen vår, og vi omfavner vår kjerneidé - AI for alle.
Opplev det nå: https://t.co/zHJpeVpX3t. Klone stemmer med enestående presisjon, med detaljert kontroll over tonefall, fra følelser til aksent, rytme, pauser og intonasjon, ved hjelp av bare en... pic.twitter.com/RwmYajpxOt
- MyShell (@myshell_ai) 2. januar 2024
Hany Farid, professor ved University of California, Berkley, har spesialisert seg på digital kriminalteknikk og autentisering av digitale medier. Da en WJZ-reporter ba Farid om å analysere klippet, sa han at det åpenbart hadde blitt redigert, men utover det kunne han ikke bekrefte om det var autentisk eller ikke.
I et intervju med Scientific American sa Farid: "Jeg har analysert lyden med noen av våre verktøy, som ennå ikke er offentlig tilgjengelige. Jeg tror det er sannsynlig - men ikke sikkert - at denne lyden er AI-generert ... Samlet sett tror jeg bevisene peker mot at denne lyden er uautentisk. Men før vi tar en endelig avgjørelse, må vi lære mer."
Farid sa at det kanskje fantes fem eller færre laboratorier på verdensbasis som på en pålitelig måte kunne avgjøre om lyden var en AI-falsk eller ekte.
AI-klonen som Dudesy laget av George Carlin er et godt eksempel på hvordan AI-stemmekloning begynner å bli veldig god til å matche tonefall og følelser. Videoen har siden blitt gjort utilgjengelig.
Folkene bak chatbotene mysentient.ai har laget en parodi på Debatt mellom Trump og Biden. Tingene som "Trump" og "Biden" sier er så sprø at det åpenbart er laget for komisk effekt, men de høres veldig bra ut.
Etter hvert som disse verktøyene blir bedre og mer fritt tilgjengelige, kommer situasjoner som den rektoren i Baltimore sto overfor, til å påvirke både politikere og vanlige folk i stadig større grad.
Hvis du har sendt en WhatsApp-melding eller lagt igjen en beskjed på en telefonsvarertjeneste, kan du stå for tur. Eller, hvis noen har spilt inn deg mens du sier noe pinlig, kan du bare si at det er en AI-falsk. Ingen ser ut til å kunne bevise det uansett.