I sit bidrag til den igangværende revision af de australske regler for kunstig intelligens har Google bedt om lempeligere copyright-love for AI-træningsdata.
I de sidste par måneder har Australien øget tempoet i forsøget på at regulere brugen af AI inden for landets grænser. Det startede en gennemgang af lovgivningsmæssige rammer omkring AI i juni, og et af diskussionspunkterne er, hvordan onlinedata bruges til at træne AI-modeller.
Google har længe støttet en "fair use"-tilgang i stedet for strengere copyright-love, der ville blokere AI-dataskrabere fuldstændigt. Et eksempel på fair use er, hvordan Google gennemsøger internettet for at levere gyldige søgeresultater.
Googles webcrawler kopierer noget af en hjemmesides indhold og viser det derefter i søgeresultaterne. For det meste er der ingen, der ser det som et brud på ophavsretten. Hvis du ikke vil have Google til at crawle din hjemmeside, kan du blokere dens webcrawler.
I sit indlæg til de australske myndigheder foreslår Google, at virksomheder som Google får lov til at scrape offentliggjort materiale for at træne sine AI-modeller, medmindre udgiverne aktivt fravælger det. OpenAI vil også følge denne diskussion med interesse efter for nylig at have frigiver sin scraper GPTbot.
I en blogindlæg i juliforeslog Google, at udgiverne måske kunne bruge en tilgang, der svarer til, hvordan hjemmesider bruger deres robots.txt-filer. Disse filer indeholder i øjeblikket instruktioner, der enten tillader eller afviser, at Google crawler webstedet for sin søgemaskine.
Sådan fungerer ophavsret ikke
Den løsning, Google foreslår, er dog i strid med princippet om ophavsret.
Dr. Kayleen Manwaring, lektor ved UNSW Law and Justice, sagde til The Guardian: "Hvis du vil gengive noget, som en ophavsretsejer har, skal du have deres samtykke, ikke en slags opt out-ordning ... det, de foreslår, er en gennemgribende ændring af den måde, undtagelserne fungerer på."
Det giver god mening. Hvis du vil kopiere og bruge andres arbejde, skal du spørge dem om lov. Google foreslår det, hvis du ikke udtrykkeligt har bedt dem om at lade være, så burde dine data være fair game.
Med kreative på tværs af en række genrer, der fordømmer Engrosforbrug af deres arbejde af generativ AI, svømmer Google måske mod strømmen i dette spørgsmål.
For at gøre ondt værre er der blevet strammet op på, hvordan Google i øjeblikket scraper og bruger indhold fra nyhedsudgivere.
I sidste ende vil brugerne gerne have nyttige AI-værktøjer, og det kræver, at AI-modeller trænes på en masse menneskeskabt indhold. Det bliver ikke nemt at finde en retfærdig måde at gøre det på.