Nella sua presentazione alla revisione in corso del quadro normativo australiano sull'IA, Google ha chiesto un allentamento delle leggi sul copyright per i dati di addestramento dell'IA.
Negli ultimi mesi, l'Australia ha accelerato il ritmo con cui cerca di regolamentare l'uso dell'IA all'interno dei suoi confini. Ha avviato una revisione della quadro normativo sull'IA a giugno e uno dei punti di discussione è il modo in cui i dati online vengono utilizzati per addestrare i modelli di intelligenza artificiale.
Google sostiene da tempo un approccio di "fair use" piuttosto che leggi più severe sul copyright che bloccherebbero completamente i data scrapers dell'IA. Un esempio di fair use è il modo in cui Google effettua il crawling di Internet per fornire risultati di ricerca validi.
Il web crawler di Google copia alcuni contenuti di un sito web e li visualizza nei risultati di ricerca. Nella maggior parte dei casi, nessuno la considera una violazione del copyright. Se non volete che Google effettui la scansione del vostro sito, potete bloccare il suo web crawler.
Nella sua presentazione alle autorità australiane, Google suggerisce di consentire ad aziende come la sua di raccogliere materiale pubblicato per addestrare i suoi modelli di intelligenza artificiale, a meno che gli editori non si oppongano attivamente. Anche OpenAI seguirà con interesse questa discussione, dopo aver recentemente rilasciando il suo scraper GPTbot.
In un post sul blog a luglioGoogle ha suggerito che gli editori potrebbero utilizzare un approccio simile a quello con cui i siti web utilizzano i loro file robots.txt. Questi file contengono attualmente istruzioni che consentono o meno a Google di effettuare il crawling del sito per il suo motore di ricerca.
Non è così che funziona il copyright
La soluzione proposta da Google va però contro il principio del copyright.
La dottoressa Kayleen Manwaring, docente senior presso la UNSW Law and Justice, ha dichiarato al The Guardian: "Se si vuole riprodurre qualcosa che è detenuto da un proprietario di copyright, è necessario ottenere il suo consenso, non un tipo di accordo di opt-out ... quello che stanno suggerendo è una revisione totale del modo in cui funzionano le eccezioni".
Questo ha senso. Se si vuole copiare e utilizzare il lavoro di qualcuno, è necessario chiedergli il permesso. Google suggerisce di farlo se non si è espressamente detto di non farlo, allora i vostri dati dovrebbero essere validi.
Con i creativi di diversi generi che hanno criticato la consumo all'ingrosso del loro lavoro dalle IA generative, Google potrebbe nuotare controcorrente su questo tema.
Ad aggravare i suoi problemi c'è la stretta sulle modalità con cui Google attualmente effettua lo scraping e utilizza i contenuti degli editori di notizie.
In definitiva, gli utenti vogliono avere strumenti di IA utili e ciò richiede che i modelli di IA siano addestrati su molti contenuti generati dall'uomo. Trovare un modo equo per farlo non sarà facile.