OpenAI har opfordret en dommer til at afvise New York Times' retssag mod Microsoft og OpenAI, idet avisen beskyldes for at "hacke" deres produkter.
De beskylder New York Times for at opdigte krænkelser af ophavsretten gennem en omfattende og manipulerende proces, der involverer "titusindvis af forsøg" og "vildledende opfordringer, der åbenlyst overtræder OpenAI's brugsbetingelser".
Det stærkt formulerede retsindlæg indledes med: "Anklagerne i Times' klage lever ikke op til deres berømte strenge journalistiske standarder. Sandheden, som vil komme frem i løbet af denne sag, er, at Times betalte nogen for at hacke OpenAI's produkter."
New York Times er søger omfattende erstatning fra både Microsoft og OpenAI.
Mens der er en stadigt voksende bunke af retssager Denne sag, der involverer AI-virksomheder fra alle hjørner af de kreative industrier, er klar til at blive en skelsættende sag. Den kan omforme landskabet for AI-udvikling og ophavsret.
Men du kan være sikker på, at Big Tech vil kæmpe med næb og klør. "Normale mennesker bruger ikke OpenAI's produkter på denne måde," hævdede OpenAI i deres seneste ansøgning.
Udtrykket "prompt engineering" eller "red-teaming", som OpenAI nævner i sin juridiske ansøgning, fungerer som en stresstest, der er designet til at afsløre sårbarheder i AI-systemer.
Når man fodrer generative AI-systemer med specifikt designede opfordringer, tvinger man dem til at negere deres sikkerhedsnet og opfører sig uregelmæssigt.
Det har ført til en række mærkelige og potentielt farlige reaktioner, som f.eks. at tilbyde hjælp til at fremstille bomber eller opfordrer til selvmord og andre skadelige aktiviteter.
OpenAI's indlæg, tilgængelig herOpenAI og de andre sagsøgte i disse retssager vil i sidste ende sejre, fordi ingen - ikke engang New York Times - får lov til at monopolisere fakta eller sprogregler."
Der står også: "I modsætning til påstandene i klagen er ChatGPT dog ikke på nogen måde en erstatning for et abonnement på The New York Times. I den virkelige verden bruger folk ikke ChatGPT eller noget andet OpenAI-produkt til det formål. Det kunne de heller ikke."
Dette er afgørende, da NYT skal overbevise dommeren om økonomiske skader som følge af OpenAI's krænkelse.
Copyright: Fair brug eller smuthul?
Det er en åben hemmelighed, at generative AI-modeller let trænes på copyright-data, nogle i højere grad end andre.
OpenAI indrømmede dette i en forudgående forelæggelse for det britiske overhus"Fordi ophavsret i dag dækker stort set alle former for menneskelige udtryk - inklusive blogindlæg, fotografier, forumindlæg, stumper af softwarekode og regeringsdokumenter - ville det være umuligt at træne nutidens førende AI-modeller uden at bruge ophavsretligt beskyttet materiale."
OpenAI fortsatte med, hvad nogle opfattede som en freudiansk smutter: "At begrænse træningsdata til offentligt tilgængelige bøger og tegninger, der er skabt for mere end et århundrede siden, kan give et interessant eksperiment, men det vil ikke give AI-systemer, der opfylder behovene hos nutidens borgere."
Der er ingen tvivl om, at AI-virksomheder har til hensigt at bruge ophavsretligt beskyttede data. Men det betyder ikke, at loven om ophavsret, som er en konstruktion fra før AI, ikke er på deres side.
Under en diskussion i Davos i Schweiz udtrykte OpenAI's CEO, Sam Altman, sin forbløffelse over retssagen mod NYT og afklarede en almindelig misforståelse om behovet for avisens data til træning af OpenAI's modeller.
"Vi behøver faktisk ikke at træne på deres data", sagde Altman og fremhævede den ubetydelige effekt af at udelukke data fra en enkelt udgiver på ChatGPT's resultater.
Ikke desto mindre anerkender OpenAI den potentielle kumulative effekt af, at flere udgivere trækker deres indhold tilbage, og er ved at sikre sig aftaler om at bruge indhold fra mediehuse til AI-træningsformål.
A nylig undersøgelse fra Reuters Institute for the Study of Journalism ved University of Oxford fandt, at omkring 48% af de store nyhedssider nu blokerer OpenAI's webcrawlere, hvilket i høj grad kan begrænse virksomhedens adgang til friske data af høj kvalitet.
OpenAI og andre teknologivirksomheder vil sandsynligvis skulle begynde at betale for data, men de vil ikke blive straffet for deres hidtidige udnyttelse.