Cosa, un altro?!
OpenAI e Microsoft sono stati colpiti da un'altra causa, che questa volta coinvolge i media digitali Raw Story, AlterNet e The Intercept per presunte violazioni del copyright.
Queste aziende hanno intrapreso un'azione legale contro il duo tecnologico per aver utilizzato contenuti protetti da copyright senza un adeguato credito nell'addestramento delle loro tecnologie AI, chiedendo un risarcimento monetario e la rimozione dei contenuti dai dataset di addestramento dell'AI.
Si tratta di una storia già nota e della seconda causa che OpenAI ha dovuto affrontare nelle ultime 24 ore, visto che Elon Musk sta cercando di fare causa ai fondatori dell'aziendaGreg Brockman e Sam Altman, per aver violato l'accordo di fondazione dell'azienda.
Questa nuova causa sul copyright sostiene che ChatGPT si è formato su materiale giornalistico protetto da copyright senza i necessari crediti o citazioni, con richieste di almeno $2.500 per ogni violazione.
Il la presentazione spiega, "I sistemi generativi di intelligenza artificiale (AI) e i modelli linguistici di grandi dimensioni (LLM) vengono addestrati utilizzando opere create dagli esseri umani. I sistemi di intelligenza artificiale e gli LLM ingeriscono quantità massicce di creatività umana e la utilizzano per imitare il modo in cui gli esseri umani scrivono e parlano. Questi set di addestramento hanno incluso centinaia di migliaia, se non milioni, di opere giornalistiche".
Si fa inoltre appello a un recente studio di CopyleaksSecondo il pluripremiato sito web Copyleaks, quasi 60% delle risposte fornite dal prodotto GPT-3.5 dei convenuti in uno studio condotto da Copyleaks contenevano una qualche forma di contenuto plagiato e oltre 45% contenevano testo identico a contenuti preesistenti".
In una dichiarazione coraggiosa, John Byrne, amministratore delegato e fondatore di Raw Story e proprietario di AlterNet, ha espresso la crescente frustrazione per le pratiche di Big Tech, affermando: "È tempo che le organizzazioni giornalistiche si ribellino ai continui tentativi di Big Tech di monetizzare il lavoro altrui. Le Big Tech hanno decimato il giornalismo. È ora che gli editori prendano posizione".
Come in altre cause, la preoccupazione principale è che le aziende di IA come OpenAI abbiano addestrato i loro modelli su grandi quantità di dati che ritengono "open source", "di dominio pubblico" o "fair use".
Il problema è che questi concetti sono molto ambigui. La stessa legge sul diritto d'autore non è stata concepita per l'addestramento di modelli di intelligenza artificiale.
OpenAI ha recentemente risposto alla causa del New York Times, che probabilmente è quella di più alto profilo, sostenendo che la Il NYT ha pagato qualcuno per "hackerare" i loro prodotti.
OpenAI ha sostenuto che il NYT ha utilizzato prompt complessi per produrre forzatamente casi di violazione del copyright.
Tuttavia, il NYT ha ribattuto affermando che, poiché le aziende di IA non divulgano i loro dati di addestramento, le persone non hanno altra scelta se non quella di effettuare il reverse engineering dei prodotti per scoprirli.
Con l'aumento delle tensioni sulle aziende di IA generativa, il settore si sta avvicinando a un bivio.