O New York Times está a considerar a possibilidade de intentar uma ação judicial contra a OpenAI por suspeitas de que esta tenha extraído o seu conteúdo noticioso para treinar o ChatGPT.
A OpenAI admite que extraiu dados que estavam disponíveis gratuitamente na Internet, mas não revelou exatamente quais os dados que utilizou. A empresa não obteve autorização para utilizar os dados, mas as leis relativas à extração de dados para treino de IA não são claras.
Para além da questão da utilização dos seus dados sem autorização, o NYT está preocupado com o facto de as respostas do ChatGPT poderem estar em concorrência com o seu próprio conteúdo, para além de constituírem uma violação dos direitos de autor.
Se um utilizador perguntasse ao ChatGPT sobre um acontecimento digno de notícia, a resposta poderia conter uma resposta parafraseada com base numa reportagem originalmente publicada pelo NYT.
Antes do ChatGPT (BC?), um utilizador escrevia a pergunta no Google e depois clicava no sítio Web do NYT, onde a empresa de comunicação social podia rentabilizar o conteúdo publicado. Agora, um utilizador pode potencialmente obter a resposta sem qualquer receita para a empresa que criou o material.
O que poderia acontecer se o NYT processasse a OpenAI?
Há muitos "ses", mas se o NYT se juntar à lista crescente de outros que estão a processar a OpenAI e ganhar o processo, poderá haver consequências graves.
A lei federal dos direitos de autor estipula que, se a OpenAI violar deliberadamente os direitos de autor, pode ser multada em até $150.000 por cada infração. O NYT tem um enorme repositório de material arquivado, por isso, dependendo da forma como o juiz encara as "infracções individuais", esta pode ser uma multa que pode acabar com a empresa.
A lei federal de direitos de autor também permite que o material que violou os direitos de autor seja destruído. Isso é um grande problema para a OpenAI. O material violado é o conjunto de dados de treino para o ChatGPT.
Se isso for destruído, significa que a OpenAI tem de reconstruir o ChatGPT a partir do zero. E, desta vez, sem o benefício da recolha gratuita de dados da Internet.
O que é que as outras empresas de comunicação social estão a fazer?
Barry Diller, presidente da IAC, está a liderar uma coligação de editores importantes para instaurar coletivamente processos judiciais contra empresas de IA, a fim de obterem uma compensação pelo que dizem ser violações dos seus direitos de autor.
O NYT entrou em conversações com o grupo, mas posteriormente recusou-se a aderir à sua coligação.
Em julho, a The Associated Press fez um acordo com a OpenAI para licenciar os seus conteúdos que remontam a 1985. O acordo reconhece o benefício mútuo, uma vez que a AP procura utilizar a IA generativa da OpenAI nas suas operações.
Numa declaração conjunta, as empresas afirmaram que "o acordo prevê que a OpenAI licencie parte do arquivo de texto da AP, enquanto a AP aproveitará a tecnologia e a experiência de produto da OpenAI".
Este acordo é provavelmente um bom exemplo da forma como muitas destas questões entre editores e empresas de IA serão resolvidas. Este cenário representa provavelmente o melhor cenário possível para a OpenAI.
Mas, com batalhas legais crescentes e relações tensas com o seu principal investidorA situação parece estar a ir de mal a pior para a OpenAI.