Flere forfattere forsøker å saksøke OpenAI for bruk av opphavsrettslig beskyttet materiale

10. juli 2023

chatgpt Lovsak

AI-søksmålene hagler etter hvert som den amerikanske komikeren og forfatteren Sarah Silverman og forfatterne Christopher Golden og Richard Kadrey går til søksmål mot OpenAI og Meta.

Trioen hevder at opphavsretten er krenket, og at arbeidet deres ble ulovlig brukt til opplæring av ChatGPT og LLaMA, Metas store språkmodell (LLM) med åpen kildekode. 

ChatGPT er avhengig av å analysere en kolossal mengde data hentet fra internett - det er disse dataene som lærer den hvordan den skal håndtere naturlig språk. Det er mange spørsmål knyttet til hvor disse treningsdataene kommer fra og hvilke metoder som er brukt for å hente dem inn, og mistanken øker nå som skaperne oppdager at arbeidet deres muligens ligger i disse treningsdataene. 

I dette siste søksmålet anklages OpenAI og Meta for å ha brukt saksøkernes opphavsrettsbeskyttede bøker som treningsdata uten deres samtykke. 

Søksmålene tyder på at materialet ble hentet fra "skyggebibliotek"-nettsteder. Skyggebiblioteker inneholder store mengder ulovlig kopiert informasjon, inkludert nettsteder som Bibliotik, Library Genesis og Z-Library. Skyggebiblioteker ligner på torrents - de er vanskelige å forhindre og kontrollere. 

OpenAI beskyldes for å ha oppsummert tre bøker nøyaktig når de ble bedt om det: Silvermans "The Bedwetter", Goldens "Ararat" og Kadreys "Sandman Slim". Selv om den kunstige intelligensen kunne lære om slike bøker fra Wikipedia-sammendrag og lignende, ville ikke dette forklare detaljnivået i sammendragene. 

I søksmålet mot Meta nevnes flere verk av Kadrey og Golden, samt "The Bedwetter", som refererer til et Meta-dokument som indikerer bruk av materiale fra skyggebiblioteker, noe søksmålet betegner som "åpenbart ulovlig". 

Metas artikkel "Vi inkluderer to bokkorpora i treningsdatasettet vårt: Gutenberg-prosjektet, som inneholder bøker som er offentlig tilgjengelige, og Books3-delen av ThePile (Gao et al., 2020), et offentlig tilgjengelig datasett for trening av store språkmodeller." 

Joseph Saveri og Matthew Butterick, advokatene som representerer trioen, har rapportert om økende bekymring for ChatGPTs foruroligende evne til å etterligne opphavsrettsbeskyttet tekst.

Forskning har vist at GPT-4 nesten helt sikkert har lært av opphavsrettsbeskyttede verk.

Det kan imidlertid skyldes at de er populære og har fått stor utbredelse, eller at de er pensumlitteratur på skoler og universiteter. 

Det vil uansett ikke frita AI-selskaper fra å bruke slike tekster i treningsdataene sine.

AI-relaterte søksmål øker

Kunstig intelligens har blitt sentrum for en storm av søksmål, og mange av dem regnes som de første i sitt slag. 

De samme advokatene representerer også de amerikanske forfatterne Mona Awad og Paul Tremblay i en separat, men nesten identisk gruppesøksmål mot OpenAI. 

Og igjen, det samme juridiske teamet, Saveri og Butterick, er representerer 3 kunstnere - Sarah Andersen, Kelly McKernan og Karla Ortiz - i et søksmål mot bildegeneratorene Stability AI og Midjourney. 

Det samme advokatfirmaet representerte en saken mot Microsft og GitHubsaksøkerne hevder at deres AI-verktøy Copilot AI-verktøy profiterte på arbeidet til programmerere med åpen kildekode. Det er en svært lik sak - saksøkerne hevder at AI-verktøyet er trent på informasjon som inneholder "åpen kildekode"-data som er hentet ut på ulovlig vis. 

Her hevder de saksøkte at "Paragraf 1202(b) i USAs Digital Millennium Copyright Act "handler om identiske 'kopier ... av et verk' - ikke om løsrevne utdrag og bearbeidelser." AI-selskaper kan argumentere på samme måte mot forfattere, og hevde at sammendragene av verkene deres ikke er tilstrekkelige til å underbygge argumentet om at bøkene finnes i opplæringsdataene i sin helhet.

Uansett hoper anklagene seg opp, noe som tyder på en trend med økende juridisk press på AI-selskaper.

AI-forskrifter som f.eks. EUs AI-lov vil kreve at selskaper offentliggjør informasjon om opphavsrettsbeskyttede data i opplæringsdataene sine. Det gjenstår å se om det vil ha den ønskede effekten. 

Bli med i fremtiden


ABONNER I DAG

Tydelig, kortfattet og omfattende. Få et grep om AI-utviklingen med DagligAI

Sam Jeans

Sam er en vitenskaps- og teknologiskribent som har jobbet i ulike oppstartsbedrifter innen kunstig intelligens. Når han ikke skriver, leser han medisinske tidsskrifter eller graver seg gjennom esker med vinylplater.

×

GRATIS PDF EKSKLUSIV
Hold deg i forkant med DailyAI

Meld deg på vårt ukentlige nyhetsbrev og få eksklusiv tilgang til DailyAIs nyeste e-bok: "Mastering AI Tools: Din 2024-guide til økt produktivitet".

*Ved å abonnere på vårt nyhetsbrev aksepterer du vår Retningslinjer for personvern og vår Vilkår og betingelser