Falska AI-klonade röster hamnade nyligen på nyhetsplats på grund av ett robotsamtal från "Biden", men vanliga människor drabbas i takt med att tekniken blir mer tillgänglig och svårare att upptäcka.
För två veckor sedan släpptes en ljudinspelning av Pikesville High-rektorn Eric Eiswert där det lät som om Eiswert gjorde rasistiska och antisemitiska kommentarer om personal och studenter.
Eiswert förnekade att ljudfilen var äkta, en ståndpunkt som stöddes av Billy Burke, verkställande direktör för Council of Administrative and Supervisory Employees, som representerar administratörer i Baltimore County.
"Vi tror att den är AI-genererad", sa Burke. "Det sa han inte."
I en tid av AI-förfalskningar är "Lögnarens utdelning" ger vem som helst en enkel utväg att ropa "Fake!" när de är i en svår situation. Samtidigt kan AI-röstkloning orsaka mycket ryktesskada för vanliga människor som Eiswert.
Vad tycker du om det? Falskt eller äkta?
Visa detta inlägg på Instagram
Antingen är ljudet äkta och han borde få sparken, eller så är det en AI-fejk och någon borde stämmas.
Två veckor senare kan ingen säga, så Eiswerts jobb och rykte förblir i limbo. Det är ett bevis på hur bra dessa röstkloningsverktyg blir och de komplexa frågor som tekniken väcker.
För ett år sedan hade vi kanske avfärdat Eiswerts påstående om AI-fusk och hävdat att sådan avancerad AI-teknik inte existerade. Nu gör företag som Eleven Labs eller billiga verktyg som Parrot AI det enkelt för vem som helst att göra imponerande röstkloner.
OpenVoice, som släpptes tidigare den här månaden, använder bara några sekunders ljud för att klona en röst och möjliggör detaljerad kontroll över känslor, accent, ton, rytm och mycket mer.
Idag är vi stolta över att ha öppen källkod för vår OpenVoice-algoritm, och vi följer vår grundtanke - AI för alla.
Upplev det nu: https://t.co/zHJpeVpX3t. Klona röster med oöverträffad precision, med granulär kontroll över tonen, från känsla till accent, rytm, pauser och intonation, med bara en knapptryckning... pic.twitter.com/RwmYajpxOt
- MyShell (@myshell_ai) 2 januari 2024
Hany Farid, professor vid University of California, Berkley, är specialiserad på digital kriminalteknik och autentisering av digitala medier. När en WJZ-reporter bad Farid att analysera klippet sa han att det uppenbarligen hade redigerats, men utöver det kunde han inte bekräfta om det var autentiskt eller inte.
I en intervju med Scientific American sa Farid: "Jag har analyserat ljudet med några av våra verktyg, som ännu inte är offentligt tillgängliga. Jag tror att det är troligt - men inte säkert - att detta ljud är AI-genererat ... Sammantaget tror jag att bevisen pekar på att detta ljud är oäkta. Men innan vi gör en slutgiltig bedömning behöver vi lära oss mer."
Farid sa att det kanske fanns 5 eller färre laboratorier i världen som på ett tillförlitligt sätt kunde avgöra om ljudet är en AI-fejk eller äkta.
AI-klonen som Dudesy skapade av George Carlin är ett bra exempel på hur AI-röstkloning blir riktigt bra på att matcha böjning och känsla. Den videon har sedan dess gjorts otillgänglig.
Personerna bakom chatbotarna mysentient.ai har skapat en parodi Debatt mellan Trump och Biden. De saker som "Trump" och "Biden" säger är så galna att det uppenbarligen är gjort för komisk effekt, men de låter riktigt bra.
I takt med att dessa verktyg blir bättre och mer fritt tillgängliga kommer situationer som den som rektorn i Baltimore ställdes inför att påverka både politiker och vanliga människor i allt högre grad.
Om du har skickat ett röstmeddelande till WhatsApp eller lämnat ett meddelande till en telefonsvarare kan du stå på tur. Eller, om någon spelade in dig när du sa något besvärligt, kan du bara säga att det är en AI-fejk. Ingen verkar kunna bevisa det på något sätt.