Journalisterna Nicholas Gage och Nicholas Basbanes har inlett en upphovsrättslig process mot OpenAI och Microsoft, där de hävdar att deras verk har använts utan samtycke för att utbilda ChatGPT.
Nicholas Gage, känd för sin memoarbok "Eleni" om andra världskriget, har arbetat för The New York Times och The Wall Street Journal. Nicholas Basbanes, tidigare journalist, har skrivit flera böcker med fokus på förlags- och bokhistoria.
Journalisterna företräds av Grant Herrmann Schwartz & Klinger LLP och följer tätt i spåren av en liknande, banbrytande stämning av The New York Times mot dessa ledande AI-bolag.
I sitt klagomål, som lämnats in till Manhattans federala domstol, hävdar Gage, en undersökande journalist, och Basbanes, en författare, att OpenAI har erkänt att de använder e-boksdataset, inklusive "Books2", som kommer från piratkopierade databaser.
De konstaterade att "OpenAI har erkänt att de använder e-boksdataset inklusive 'Books2' som sannolikt kommer från piratkopierade arkiv på nätet."
Denna stämning är i linje med andra från kända författare som Sarah Silverman, George R.R. Martin och Authors Guild.
I konstvärlden har AI-företagen drabbats av en liknande störtflod av rättsfall. Ett av de mest anmärkningsvärda inges mot Stability AI, Midjourney och Deviantart, återigen med anspråk på upphovsrättsintrång i konstnärers verk.
En domstol avslog klagomålet, men det lämnades in på nytt med mer bevis, inklusive en lista med 16.000 artistnamn som hittades i ett läckt kalkylblad som tillskrivs Midjourneys utvecklare.
I den senaste stämningsansökan hävdar kärandena att OpenAI:s senaste modell, ChatGPT-4, på särskild uppmaning kan återge nästan ordagrann text av hela upphovsrättsskyddade artiklar - ett påstående som fram till nu inte hade tagits upp i rättsliga förfaranden.
Enligt Bloomberg LawI stämningsansökan står det: "Fram till nyligen tillhandahöll ChatGPT ordagranna citat av upphovsrättsskyddad text."
"För närvarande erbjuder man sig istället att producera sammanfattningar av sådan text", "Dessa sammanfattningar är i sig derivatverk, vars skapande till sin natur är baserat på det ursprungliga olagligt kopierade verket".
AI-bolagen har tidigare hävdat att kopiering av böcker och artiklar för träning av stora språkmodeller faller under upphovsrättslagens doktrin om "fair use", vilket är centralt för deras försvar i denna debatt.
Det finns dock en påtaglig känsla av att detta försvar är på tunn is.