Författarna Mona Awad och Paul Tremblay har lämnat in en stämningsansökan mot OpenAI, skaparen av ChatGPT.
Mona Awad, författare till 13 Ways of Looking at a Fat Girl, och Paul Tremblay, författare till The Cabin at the End of the World, hävdar att AI-plattformen gjorde intrång i deras upphovsrätt genom att träna sin modell på deras verk utan samtycke.
ChatGPT tränas på allmänt tillgängliga data från internet. Men enligt Awad och Tremblay användes deras upphovsrättsskyddade romaner olagligt för att träna ChatGPT, en misstanke som väcktes på grund av chatbotens förmåga att generera "mycket exakta sammanfattningar" av deras böcker, enligt vad som anges i stämningsdokumenten.
Författarna hävdar att när de bad ChatGPT att ge sammanfattningar av sina romaner, returnerade AI information som inte är uppenbarligen offentligt tillgängliga. ChatGPT kan visserligen lära sig av sammanfattningar som publiceras på webbplatser som Wikipedia, men dessa ger inte tillräckligt med detaljer för att motivera djupet i AI:s sammanfattning. Kärandeparterna tillhandahålla utställningar för att visa detta.
Det här är det första i sitt slag mot OpenAI när det gäller upphovsrättsfrågor, säger Andres Guadamuz, som är docent i immaterialrätt vid University of Sussex.
Med detta sagt är det nästa inlägg i en lång rad rättsliga ärenden som lämnats in mot OpenAI, även om de flesta är Mål om förtal.
Dessutom har det förekommit flera upphovsrättsfall inom området bildgenerering, däribland Getty Images, som lämnade in en stämningsansökan stämningsansökan mot Stability AI för att ha använt dess bilder utan ersättning.
AI-användning av "skuggbibliotek"
Saveri och Butterick hävdar att OpenAI har blivit "alltmer hemlighetsfullt" när det gäller sina träningsdata, vilket förmodligen är en rättvis kommentar. I de tidiga utvecklingsfaserna av ChatGPT avslöjade OpenAI att de använde en stor "internetbaserad bokkorpus" för träning, kallad "Books2".
Med tanke på de uppskattningsvis 294.000 titlarna i datasetet misstänker advokaterna att OpenAI har hämtat böckerna från "skuggbibliotek" som Library Genesis (LibGen) och Z-Library. Så kallade skuggbibliotek är digitala arkiv för böcker och akademiska uppsatser.
Även om de i första hand är avsedda för akademiskt bruk innehåller de flesta olagligt kopierade böcker.
Det råder mycket liten enighet om de olika juridiska aspekterna av skuggbibliotek - de har blivit en del av internets möbler.
Den klagomål säger, "Dessa uppenbart olagliga skuggbibliotek har länge varit av intresse för AI-utbildningsgemenskapen."
I en rapport från The GuardianLilian Edwards, professor i juridik, innovation och samhälle vid Newcastle University, gissar att just detta fall kan bero på om domstolarna anser att det är "fair use" att använda upphovsrättsskyddat material för AI-träning. Definitionerna av "fair use" varierar internationellt, vilket komplicerar problemet ytterligare.
Oddsen för framgång? Sannolikt små, men det juridiska trycket ökar på AI-företag av alla slag.
Kommande AI-regleringar, som t.ex. EU:s AI-lagkommer att införa riktlinjer för transparens som tvingar utvecklare att publicera sina utbildningsdata.