OpenAI critica o New York Times, alegando que "piratearam" as suas provas

27 de fevereiro de 2024

IA DO NYT

A OpenAI pediu a um juiz que rejeitasse o processo do The New York Times contra a Microsoft e a OpenAI, acusando o jornal de "piratear" os seus produtos. 

Acusam o The New York Times de fabricar infracções aos direitos de autor através de um processo exaustivo e manipulador que envolveu "dezenas de milhares de tentativas" e "sugestões enganadoras que violam claramente os termos de utilização da OpenAI".

A apresentação do tribunal, redigida com veemência, abre: "As alegações da queixa do Times não satisfazem os seus famosos padrões jornalísticos rigorosos. A verdade, que será revelada no decorrer deste caso, é que o Times pagou a alguém para piratear os produtos da OpenAI".

O New York Times é pedir indemnizações avultadas da Microsoft e da OpenAI. 

Embora exista um pilha crescente de processos judiciais envolvendo empresas de IA de todos os cantos das indústrias criativas, este caso está pronto para ser um marco. Poderá alterar o panorama do desenvolvimento da IA e da lei dos direitos de autor. 

No entanto, pode ter a certeza de que a Big Tech vai lutar com unhas e dentes. "As pessoas normais não utilizam os produtos da OpenAI desta forma", afirmou a OpenAI no seu recente pedido de registo. 

O termo "prompt engineering" ou "red-teaming", tal como mencionado pela OpenAI no seu processo judicial, funciona como um teste de resistência concebido para descobrir vulnerabilidades nos sistemas de IA. 

Alimentar os sistemas de IA generativa com instruções especificamente concebidas coage-os a negar as suas protecções e comportamento irregular.

Isto levou a uma série de reacções estranhas e potencialmente perigosas, como a oferta de ajudar a fabricar bombas ou encorajar o suicídio e outras actividades prejudiciais. 

Apresentação da OpenAI, disponível aquiA OpenAI e os outros arguidos nestes processos acabarão por prevalecer, porque ninguém - nem mesmo o New York Times - consegue monopolizar os factos ou as regras da linguagem".

Afirma ainda: "Contrariamente às alegações da Queixa, no entanto, o ChatGPT não substitui de forma alguma uma subscrição do The New York Times. No mundo real, as pessoas não usam o ChatGPT ou qualquer outro produto da OpenAI para esse fim. Nem poderiam".

Isto é crucial, uma vez que o NYT tem de convencer o juiz dos danos financeiros resultantes da infração da OpenAI. 

Direitos de autor: utilização justa ou lacuna?

É um segredo aberto que os modelos de IA generativa são facilmente treinados em dados de direitos de autor, alguns em maior grau do que outros. 

A OpenAI admitiu este facto numa apresentação prévia à Câmara dos Lordes do Reino Unidoafirmando que "uma vez que os direitos de autor abrangem atualmente praticamente todo o tipo de expressão humana - incluindo publicações em blogues, fotografias, publicações em fóruns, fragmentos de código de software e documentos governamentais - seria impossível treinar os principais modelos de IA actuais sem utilizar materiais protegidos por direitos de autor".

Limitar os dados de treino a livros e desenhos do domínio público, criados há mais de um século, pode ser uma experiência interessante, mas não forneceria sistemas de IA que satisfizessem as necessidades dos cidadãos de hoje".

Não há dúvida de que as empresas de IA tencionam utilizar dados protegidos por direitos de autor. Mas isso não significa que a lei dos direitos de autor, uma construção anterior à IA, não esteja do seu lado.

Durante um debate em Davos, na Suíça, o diretor executivo da OpenAI, Sam Altman, expressou a sua surpresa com o processo do NYT, esclarecendo um equívoco comum sobre a necessidade dos dados do jornal para treinar os modelos da OpenAI. 

"Na verdade, não precisamos de treinar com os dados deles", afirmou Altman, salientando o impacto insignificante da exclusão de dados de um único editor no desempenho do ChatGPT. 

No entanto, a OpenAI reconhece o potencial efeito cumulativo de vários editores retirarem os seus conteúdos e está a obter acordos para utilizar conteúdos de empresas de comunicação social para fins de treino de IA.

A estudo recente do Instituto Reuters para o Estudo do Jornalismo da Universidade de Oxford descobriu que cerca de 48% dos principais sites de notícias estão agora a bloquear os rastreadores web da OpenAI, o que pode limitar seriamente o acesso da empresa a dados novos e de alta qualidade.

A OpenAI e outras empresas tecnológicas terão provavelmente de começar a pagar pelos dados, mas não serão penalizadas pelas suas explorações até agora.

Junte-se ao futuro


SUBSCREVER HOJE

Claro, conciso e abrangente. Fique a par dos desenvolvimentos da IA com DailyAI

Calças de ganga Sam

Sam é um escritor de ciência e tecnologia que trabalhou em várias startups de IA. Quando não está a escrever, pode ser encontrado a ler revistas médicas ou a vasculhar caixas de discos de vinil.

×

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI

Subscreva a nossa newsletter semanal e receba acesso exclusivo ao último livro eletrónico do DailyAI: 'Mastering AI Tools: Seu guia 2024 para aumentar a produtividade'.

*Ao subscrever a nossa newsletter, aceita a nossa Política de privacidade e o nosso Termos e condições