I sitt bidrag till den pågående översynen av det australiensiska regelverket för AI har Google begärt en uppluckring av upphovsrättslagarna för AI-träningsdata.
Under de senaste månaderna har Australien ökat takten i sina försök att reglera användningen av AI inom landets gränser. Man inledde en översyn av regelverk kring AI i juni och en av diskussionspunkterna är hur online-data används för att träna AI-modeller.
Google har länge stött en "fair use"-strategi snarare än striktare upphovsrättslagar som skulle blockera AI-dataskrapare helt och hållet. Ett exempel på rättvis användning är hur Google genomsöker internet för att tillhandahålla giltiga sökresultat.
Googles webbcrawler kopierar en del av innehållet på en webbplats och visar det sedan i sökresultaten. För det mesta är det ingen som ser det som ett upphovsrättsbrott. Om du inte vill att Google ska genomsöka din webbplats kan du blockera dess web crawler.
I sin inlaga till de australiensiska myndigheterna föreslår Google att företag som Google ska tillåtas att skrapa publicerat material för att träna sina AI-modeller, såvida inte utgivarna aktivt väljer bort detta. OpenAI kommer också att följa denna diskussion med intresse efter att nyligen ha släpper sin skrapa GPTbot.
I en blogginlägg i juliGoogle föreslog att utgivarna kanske kunde använda ett tillvägagångssätt som liknar hur webbplatser använder sina robots.txt-filer. Dessa filer innehåller för närvarande instruktioner som antingen tillåter eller förbjuder Google att genomsöka webbplatsen för sin sökmotor.
Det är inte så upphovsrätt fungerar
Den lösning som Google föreslår strider dock mot principen om upphovsrätt.
Dr Kayleen Manwaring, universitetslektor vid UNSW Law and Justice, sa till The Guardian: "Om du vill reproducera något som innehas av en upphovsrättsinnehavare måste du få deras samtycke, inte en opt out-typ av arrangemang ... vad de föreslår är en omfattande omarbetning av hur undantagen fungerar."
Det låter ju logiskt. Om du vill kopiera och använda någons arbete måste du be dem om tillstånd. Google föreslår det om du inte uttryckligen har sagt till dem att inte göra det, då borde din data vara fritt spelrum.
Med kreatörer inom en mängd olika genrer som fördömer storskalig konsumtion av deras arbete genom generativ AI, kan Google simma uppströms i den här frågan.
Till problemen bidrar också att Google för närvarande inte får skrapa och använda innehåll från nyhetsutgivare.
I slutändan vill användarna ha användbara AI-verktyg, och det kräver att AI-modeller tränas på mycket innehåll som genererats av människor. Det kommer inte att bli lätt att hitta ett rättvist sätt att göra det på.