Gli autori Mona Awad e Paul Tremblay hanno intentato una causa contro OpenAI, il creatore del ChatGPT.
Mona Awad, autrice di 13 Ways of Looking at a Fat Girl, e Paul Tremblay, autore di The Cabin at the End of the World, sostengono che la piattaforma di intelligenza artificiale abbia violato i loro diritti d'autore addestrando il suo modello sulle loro opere senza consenso.
ChatGPT viene addestrato su dati disponibili pubblicamente su Internet. Tuttavia, secondo Awad e Tremblay, i loro romanzi protetti da copyright sono stati utilizzati illecitamente per addestrare ChatGPT, un sospetto sollevato dalla capacità del chatbot di generare "riassunti molto accurati" dei loro libri, come si legge nei documenti della causa.
Gli autori sostengono che, quando hanno chiesto a ChatGPT di fornire i riassunti dei loro romanzi, l'intelligenza artificiale ha restituito informazioni che non sono ovviamente disponibili pubblicamente. Sebbene ChatGPT possa imparare dai riassunti pubblicati su siti come Wikipedia, questi non forniscono dettagli sufficienti a giustificare la profondità del riassunto dell'IA. I querelanti fornire reperti per dimostrarlo.
Si tratta del primo caso di questo tipo contro OpenAI per quanto riguarda il diritto d'autore, afferma Andres Guadamuz, lettore di diritto della proprietà intellettuale presso l'Università del Sussex.
Detto questo, è la prossima voce di una lunga serie di cause legali presentate contro OpenAI, anche se la maggior parte sono casi di diffamazione.
Inoltre, ci sono stati diversi casi di copyright nell'ambito della generazione di immagini, tra cui Getty Images, che ha presentato una causa contro Stability AI per l'utilizzo delle sue immagini senza compenso.
Uso dell'IA per le "biblioteche ombra
Saveri e Butterick affermano che OpenAI è diventato "sempre più riservato" riguardo ai suoi dati di addestramento, il che è probabilmente un commento corretto. Nelle prime fasi di sviluppo di ChatGPT, OpenAI ha rivelato di aver utilizzato per l'addestramento un grande "corpora di libri basato su Internet", denominato "Books2".
Considerati i 294.000 titoli stimati nel dataset, gli avvocati sospettano che OpenAI si sia procurato i libri da "biblioteche ombra" come Library Genesis (LibGen) e Z-Library. Le cosiddette biblioteche ombra sono depositi digitali di libri e documenti accademici.
Pur essendo destinati principalmente all'uso accademico, la maggior parte contiene libri copiati illegalmente.
C'è pochissimo consenso sulle varie legalità delle biblioteche ombra, che sono diventate parte dell'arredamento di Internet.
Il reclamo diceQueste biblioteche ombra, palesemente illegali, sono da tempo oggetto di interesse per la comunità dell'addestramento dell'intelligenza artificiale".
In un rapporto del GuardianLilian Edwards, docente di diritto, innovazione e società all'Università di Newcastle, ipotizza che questo caso particolare potrebbe dipendere dal fatto che i tribunali considerino l'uso di materiale protetto da copyright per l'addestramento dell'intelligenza artificiale come un "uso corretto". Le definizioni di fair use variano a livello internazionale, il che complica ulteriormente il problema.
Le probabilità di successo? Probabilmente poche, ma le pressioni legali stanno aumentando sulle aziende di IA di tutti i tipi.
I prossimi regolamenti sull'IA, come il Legge UE sull'AI, sono destinati ad applicare linee guida sulla trasparenza che obbligano gli sviluppatori a pubblicare i loro dati di addestramento.