OpenAI har svarat på två nästan identiska grupptalan som väckts mot företaget av ett antal författare och hävdat att de flesta av anklagelserna bör avvisas.
Författarna hävdar att deras upphovsrätt kränktes när företaget använde deras arbete som träningsdata för ChatGPT. Påståendena i stämningsansökan är:
- direkt upphovsrättsintrång
- Upphovsrättsintrång genom medhjälpare
- borttagning av information om hantering av upphovsrätt (DMCA)
- illojal konkurrens
- orättmätig vinning
- försummelse
OpenAI säger att de är glada över att få den första anklagelsen prövad i domstol, men att de återstående fem är felaktiga enligt lag och bör avvisas.
Kärandena hävdar att eftersom deras böcker användes för att utbilda ChatGPT, är allt som ChatGPT producerar ett derivat av deras upphovsrättsskyddade verk.
OpenAI säger att man varken kan bekräfta eller förneka att böckerna i fråga ingick i träningsdatasetet. Men man säger att även om böckerna ingick i datasetet, var det en liten del av en enorm mängd data.
OpenAI hävdade att detta föll under principen om rättvis användning (fair use) som inte gör intrång i upphovsrätten.
Författarna kan ha svårt att övertyga domstolen om sitt argument. De hävdar inte att ChatGPT skriver böcker som liknar deras och i konkurrens med dem. De säger att varje ord som ChatGPT lägger ut är ett brott mot upphovsrätten.
I sin begäran om avvisning sade OpenAI: "Enligt klagomålen är varje enskild ChatGPT-utdata - från ett enkelt svar på en fråga (t.ex. "Ja"), till namnet på USA:s president, till ett stycke som beskriver handlingen, teman och betydelsen av Homeros Iliaden - nödvändigtvis ett intrångsgörande "derivatverk" av kärandenas böcker."
Det kommer att bli svårt att argumentera för. Även de korrekta sammanfattningar som ChatGPT gör av böckerna i fråga beskrivs i ansökan som "bokrapporter eller recensioner" snarare än ett försök att tjäna pengar på upphovsrättsskyddat arbete.
Detaljerna för de återstående argumenten kan läsas i OpenAI:s yrkande om avvisning.
Varför begär OpenAI inte att hela ärendet ska avskrivas?
OpenAI:s yrkande säger att man inte begär att åtalet för direkt upphovsrättsintrång ska avvisas "vilket OpenAI kommer att försöka lösa som en fråga om lag i ett senare skede av målet".
OpenAI och Meta har inte avslöjat exakt vilka data de använde för att träna sina modeller, men det inkluderade nästan säkert mycket upphovsrättsskyddat material, inklusive böckerna från författarna som lämnade in stämningarna.
Om upphovsrättsskyddade uppgifter ingick var OpenAI säkert medvetet om det. Företaget kommer att hävda att avsikten med att få tillgång till materialet inte var att producera härledda verk och tjäna pengar på dem i konkurrens med originalen.
Om domstolen håller med kommer beslutet att skapa ett prejudikat som kommer att åberopas i ett antal andra AI-relaterade stämningar som pågår.
Ett beslut till företagets fördel innebär att det inte kan stämmas för att ha använt upphovsrättsskyddad data tidigare och att det kan fortsätta att göra det för att träna sina nya modeller. Och om domstolen beslutar att AI-träning faller under principen om rättvis användning kommer det att vara öppen säsong för andra AI-företag också.
Det är ett riskabelt drag, men någon gång måste den här frågan lösas. Om beslutet går emot OpenAI måste de skrota ChatGPT och börja träna det från grunden. Den här gången med en mycket mindre uppsättning data.