Na sua apresentação à revisão em curso do quadro regulamentar australiano da IA, a Google solicitou leis de direitos de autor mais flexíveis para os dados de treino da IA.
Nos últimos meses, a Austrália acelerou o ritmo a que tenta regular a utilização da IA dentro das suas fronteiras. Iniciou uma revisão da quadro regulamentar em matéria de IA em junho e um dos pontos de discussão é a forma como os dados em linha são utilizados para treinar modelos de IA.
A Google há muito que apoia uma abordagem de "utilização justa" em vez de leis de direitos de autor mais rigorosas que bloqueariam completamente os raspadores de dados de IA. Um exemplo de utilização justa é a forma como a Google rastreia a Internet para fornecer resultados de pesquisa válidos.
O rastreador web do Google copia parte do conteúdo de um sítio web e depois apresenta-o nos resultados da pesquisa. Na maior parte dos casos, ninguém vê isso como uma violação dos direitos de autor. Se não quiser que o Google rastreie o seu sítio, pode bloquear o rastreador Web.
Na sua apresentação às autoridades australianas, a Google sugere que empresas como ela sejam autorizadas a recolher material publicado para treinar os seus modelos de IA, a menos que os editores optem ativamente por não o fazer. A OpenAI também estará a acompanhar este debate com interesse, depois de recentemente lançando o seu scraper GPTbot.
Num publicação no blogue em julhoA Google sugeriu que os editores poderiam talvez utilizar uma abordagem semelhante à forma como os sítios Web utilizam os seus ficheiros robots.txt. Atualmente, estes ficheiros contêm instruções que permitem ou não que o Google rastreie o sítio para o seu motor de busca.
Não é assim que os direitos de autor funcionam
No entanto, a solução que a Google está a sugerir é contrária ao princípio dos direitos de autor.
A Dra. Kayleen Manwaring, professora catedrática de Direito e Justiça da UNSW, disse ao The Guardian: "Se quisermos reproduzir algo que é propriedade de um detentor de direitos de autor, temos de obter o seu consentimento, e não um acordo do tipo opt-out ... o que eles estão a sugerir é uma reformulação total da forma como as excepções funcionam".
Isso faz sentido. Se quiser copiar e utilizar o trabalho de alguém, tem de lhe pedir autorização. O Google está a sugerir isso se o utilizador não tiver dito expressamente para não o fazer, então os seus dados deveriam ser válidos.
Com os criativos de vários géneros a criticar a consumo grossista do seu trabalho por IAs generativas, a Google pode estar a nadar contra a corrente nesta questão.
A agravar os seus problemas está o facto de a Google estar a restringir a forma como atualmente recolhe e utiliza os conteúdos dos editores de notícias.
Em última análise, os utilizadores querem ter ferramentas de IA úteis, e isso exige que os modelos de IA sejam treinados com muito conteúdo gerado por humanos. Encontrar uma forma equitativa de o fazer não vai ser fácil.