OpenAI har reageret på to næsten identiske gruppesøgsmål anlagt af en række forfattere og argumenteret for, at de fleste af anklagerne bør afvises.
Forfatterne hævder, at deres ophavsret blev krænket, da virksomheden brugte deres arbejde som træningsdata til ChatGPT. Påstandene i søgsmålet er:
- direkte krænkelse af ophavsret
- stedfortrædende krænkelse af ophavsret
- Fjernelse af oplysninger om forvaltning af ophavsret (DMCA)
- unfair konkurrence
- Uretmæssig berigelse
- uagtsomhed
OpenAI siger, at de er glade for at få den første anklage prøvet i retten, men at de resterende fem er juridisk forkerte og bør afvises.
Sagsøgerne hævder, at fordi deres bøger blev brugt til at træne ChatGPT, er alt, hvad ChatGPT udsender, et derivat af deres ophavsretligt beskyttede arbejde.
OpenAI siger, at de hverken vil bekræfte eller afvise, at de pågældende bøger var en del af træningsdatasættet. Men de siger, at selv hvis bøgerne var inkluderet i datasættet, var det en lille del af en enorm mængde data.
OpenAI argumenterede for, at dette faldt ind under fair use-princippet, som ikke krænker ophavsretten.
Forfatterne kan få svært ved at overbevise retten om deres argument. De argumenterer ikke for, at ChatGPT skriver bøger, der ligner deres, og som konkurrerer med dem. De siger, at hvert eneste ord, ChatGPT udgiver, er en krænkelse af ophavsretten.
I sin anmodning om afvisning sagde OpenAI: "Ifølge klagerne er hvert eneste ChatGPT-output - fra et simpelt svar på et spørgsmål (f.eks. "Ja") til navnet på USA's præsident til et afsnit, der beskriver handlingen, temaerne og betydningen af Homers Iliaden - nødvendigvis et krænkende "afledt værk" af sagsøgernes bøger."
Det bliver svært at argumentere for. Selv de præcise resuméer, som ChatGPT producerer af de pågældende bøger, beskrives i begæringen som "bograpporter eller anmeldelser" snarere end et forsøg på at tjene penge på ophavsretligt beskyttet arbejde.
Oplysningerne om de resterende argumenter kan læses i OpenAI's anmodning om afvisning.
Hvorfor beder OpenAI ikke om at få hele sagen afvist?
I OpenAI's forslag står der, at de ikke beder om, at den direkte krænkelse af ophavsretten skal afvises, "hvilket OpenAI vil forsøge at løse som et juridisk spørgsmål på et senere tidspunkt i sagen."
OpenAI og Meta har ikke oplyst præcis, hvilke data de brugte til at træne deres modeller, men det omfattede næsten helt sikkert en masse ophavsretligt beskyttet materiale, herunder bøgerne fra de forfattere, der har anlagt retssagerne.
Hvis der indgik ophavsretligt beskyttede data, var OpenAI helt sikkert klar over det. Virksomheden vil hævde, at hensigten med at få adgang til materialet ikke var at producere afledte værker og tjene penge på dem i konkurrence med originalerne.
Hvis retten er enig, vil afgørelsen skabe præcedens, som vil blive brugt i en række andre AI-relaterede retssager, der er i gang.
En afgørelse til virksomhedens fordel vil betyde, at den ikke kan sagsøges for at have brugt ophavsretligt beskyttede data tidligere, og at den kan fortsætte med at gøre det for at træne sine nye modeller. Og hvis retten beslutter, at AI-træning falder ind under fair use-princippet, vil det også være åbent for andre AI-virksomheder.
Det er et risikabelt træk, men på et eller andet tidspunkt skal problemet løses. Hvis beslutningen går imod OpenAI, må de skrotte ChatGPT og begynde at træne den fra bunden. Denne gang med et langt mindre datasæt.