I giornalisti Nicholas Gage e Nicholas Basbanes hanno avviato una causa per copyright contro OpenAI e Microsoft, sostenendo che le loro opere sono state utilizzate senza consenso per addestrare ChatGPT.
Nicholas Gage, noto per il suo libro di memorie sulla Seconda guerra mondiale "Eleni", ha lavorato per il New York Times e il Wall Street Journal. Nicholas Basbanes, ex giornalista, è autore di diversi libri sulla storia dell'editoria e dei libri.
I giornalisti sono rappresentati dallo studio Grant Herrmann Schwartz & Klinger LLP e seguono da vicino la scia di un'analoga, rivoluzionaria causa del New York Times contro queste aziende leader nel settore dell'intelligenza artificiale.
Nella loro denuncia, depositata presso la corte federale di Manhattan, Gage, un giornalista investigativo, e Basbanes, un autore, affermano che OpenAI ha riconosciuto di aver utilizzato set di dati di e-book, tra cui "Books2", che provengono da database pirata.
Hanno dichiarato: "OpenAI ha ammesso di aver utilizzato set di dati di e-book, tra cui 'Books2', che probabilmente provengono da archivi pirata online".
Questa causa si allinea con altri di autori famosi come Sarah Silverman, George R.R. Martin e la Authors Guild.
Nella comunità dell'arte, un simile diluvio di cause legali si abbatte sulle aziende di IA. Una delle più importante è stato presentato contro Stability AI, Midjourney e Deviantart, sempre per violazione del copyright delle opere degli artisti.
Sebbene il tribunale abbia respinto la denuncia, questa è stata ripresentata con ulteriori prove, tra cui un elenco di 16.000 nomi di artisti trovati in un foglio di calcolo trapelato attribuito agli sviluppatori di Midjourney.
Nella causa più recente, i querelanti sostengono che l'ultimo modello di OpenAI, ChatGPT-4, è in grado di riprodurre, su specifica richiesta, il testo quasi integrale di interi articoli protetti da copyright.
Secondo Bloomberg LawFino a poco tempo fa, ChatGPT forniva citazioni testuali di testi protetti da copyright", si legge nella causa.
"Attualmente, invece, si offre prontamente di produrre riassunti di tali testi", "Questi riassunti stessi sono opere derivate, la cui creazione è intrinsecamente basata sull'opera originale copiata illegalmente".
Le aziende di IA hanno precedentemente sostenuto che la copia di libri e articoli per l'addestramento di modelli linguistici di grandi dimensioni rientra nella dottrina del fair use della legge sul copyright, che è il punto centrale della loro difesa in questo dibattito in evoluzione.
Tuttavia, è palpabile la sensazione che questa difesa sia sul filo del rasoio.