Forfatterne Mona Awad og Paul Tremblay har gått til søksmål mot OpenAI, skaperen av ChatGPT.
Mona Awad, forfatter av 13 Ways of Looking at a Fat Girl, og Paul Tremblay, forfatter av The Cabin at the End of the World, hevder at AI-plattformen krenket opphavsrettighetene deres ved å trene modellen sin på verkene deres uten samtykke.
ChatGPT er trent på offentlig tilgjengelige data fra internett. Ifølge Awad og Tremblay ble deres opphavsrettsbeskyttede romaner ulovlig brukt til å trene ChatGPT, en mistanke som ble reist på grunn av chatbotens evne til å generere "svært nøyaktige sammendrag" av bøkene deres, som det fremgår av søksmålsdokumentene.
Forfatterne hevder at da de ba ChatGPT om å gi sammendrag av romanene sine, returnerte AI-en informasjon som ikke er åpenbart offentlig tilgjengelig. Selv om ChatGPT kan lære av sammendrag som er publisert på nettsteder som Wikipedia, gir ikke disse tilstrekkelig med detaljer til å rettferdiggjøre dybden i den kunstige intelligensens sammendrag. Saksøkerne levere utstillinger for å demonstrere dette.
Dette er den første saken av sitt slag mot OpenAI som gjelder opphavsrett, sier Andres Guadamuz, som er lektor i immaterialrett ved University of Sussex.
Når det er sagt, er det neste sak i en lang rekke rettssaker som er anlagt mot OpenAI, selv om de fleste er injuriesaker.
Dessuten har det vært flere opphavsrettssaker innen bildegenerering, blant annet Getty Images, som har lagt inn en søksmål mot Stability AI for å bruke bildene uten kompensasjon.
AI-bruk av "skyggebibliotek"
Saveri og Butterick hevder at OpenAI har blitt "stadig mer hemmelighetsfulle" når det gjelder treningsdataene sine, noe som nok er en rimelig kommentar. I de tidlige utviklingsfasene av ChatGPT avslørte OpenAI at de brukte et stort "internettbasert bokkorpus" til opplæring, kalt "Books2".
Med tanke på de anslagsvis 294 000 titlene i datasettet mistenker advokatene at OpenAI har hentet bøkene fra "skyggebiblioteker" som Library Genesis (LibGen) og Z-Library. Såkalte skyggebibliotek er digitale arkiver for bøker og akademiske artikler.
Selv om de fleste er ment for akademisk bruk, inneholder de fleste ulovlig kopierte bøker.
Det er svært liten enighet om de ulike juridiske aspektene ved skyggebiblioteker - de har blitt en del av internettmøbleringen.
Den klagen sier"Disse åpenbart ulovlige skyggebibliotekene har lenge vært av interesse for AI-treningsmiljøet."
I en rapport fra The GuardianLilian Edwards, professor i juss, innovasjon og samfunn ved Newcastle University, antar at denne saken kan være avhengig av om domstolene anser bruk av opphavsrettsbeskyttet materiale til AI-trening som "fair use". Definisjonene av "fair use" varierer internasjonalt, noe som kompliserer problemet ytterligere.
Sjansen for å lykkes? Sannsynligvis små, men det juridiske presset øker på AI-selskaper av alle slag.
Kommende AI-forskrifter, som for eksempel EUs AI-lov, skal håndheve retningslinjer for åpenhet som forplikter utviklere til å offentliggjøre treningsdataene sine.