Wat, nog eentje?!
OpenAI en Microsoft zijn opnieuw het doelwit van een rechtszaak, dit keer tegen de digitale mediakanalen Raw Story, AlterNet en The Intercept vanwege beschuldigingen van schending van auteursrecht.
Deze bedrijven hebben juridische stappen ondernomen tegen het technische duo voor het gebruik van auteursrechtelijk beschermde inhoud zonder de juiste bronvermelding bij het trainen van hun AI-technologieën, en eisen geldelijke compensatie en verwijdering van de inhoud uit de trainingsdatasets van de AI.
Het is een bekend verhaal en de tweede rechtszaak waar OpenAI de afgelopen 24 uur mee te maken heeft gehad, nu Elon Musk probeert om de rechtszaak tegen OpenAI te voorkomen. de oprichters van het bedrijf aanklagenGreg Brockman en Sam Altman, voor het schenden van de oprichtingsovereenkomst van het bedrijf.
Deze nieuwe auteursrecht rechtszaak beweert dat ChatGPT is getraind op auteursrechtelijk beschermde journalistiek zonder de nodige credit of citatie, met eisen voor ten minste $2,500 per inbreuk.
De inzending legt uitGeneratieve kunstmatige intelligentie (AI)-systemen en grote taalmodellen (LLM's) worden getraind met door mensen gemaakte werken. AI-systemen en LLM's nemen enorme hoeveelheden menselijke creativiteit op en gebruiken die om na te bootsen hoe mensen schrijven en spreken. Deze trainingssets bevatten honderdduizenden, zo niet miljoenen, journalistieke werken."
Het doet ook een beroep op een recent onderzoek van Copyleakswaarin staat: "Volgens de bekroonde website Copyleaks bevatte bijna 60% van de antwoorden die werden gegeven door het GPT-3.5-product van de verdediging in een onderzoek uitgevoerd door Copyleaks een vorm van geplagieerde inhoud, en meer dan 45% bevatte tekst die identiek was aan reeds bestaande inhoud."
In een krachtige verklaring verwoordde John Byrne, CEO en oprichter van Raw Story en eigenaar van AlterNet, de toenemende frustratie over de praktijken van Big Tech: "Het is tijd dat nieuwsorganisaties terugvechten tegen de voortdurende pogingen van Big Tech om het werk van anderen te gelde te maken. Big Tech heeft de journalistiek gedecimeerd. Het is tijd dat uitgevers een standpunt innemen."
Net als bij andere rechtszaken is de grootste zorg hier dat AI-bedrijven zoals OpenAI hun modellen hebben getraind op enorme hoeveelheden gegevens waarvan zij denken dat ze 'open source', 'in het publieke domein' of 'fair use' zijn.
Het probleem is dat deze concepten zeer ambigu zijn. De auteurswet zelf is niet opgesteld met AI-model training in gedachten.
OpenAI heeft onlangs gereageerd op de rechtszaak tegen de New York Times, die waarschijnlijk het meest in het oog springt. NYT betaalde iemand om hun producten te 'hacken'.
OpenAI voerde aan dat de NYT complexe prompts gebruikte om gevallen van auteursrechtschending te forceren.
De NYT sloeg echter terug en zei dat omdat AI-bedrijven hun trainingsgegevens niet openbaar maken, mensen geen andere keuze hebben dan de producten te onderwerpen aan reverse-engineering om ze bloot te leggen.
Nu de spanning op generatieve AI-bedrijven toeneemt, nadert de industrie een tweesprong.