Raw Story, AlterNet e The Intercept processam a OpenAI e a Microsoft

1 de março de 2024

Ação judicial

O quê, mais um?!

A OpenAI e a Microsoft foram alvo de mais um processo judicial, desta vez envolvendo os meios de comunicação digitais Raw Story, AlterNet e The Intercept por alegada violação de direitos de autor. 

Estas empresas intentaram acções judiciais contra o duo tecnológico por utilizar conteúdos protegidos por direitos de autor sem o devido crédito no treino das suas tecnologias de IA, exigindo uma compensação monetária e a remoção dos conteúdos dos conjuntos de dados de treino da IA.

É uma história conhecida e o segundo processo judicial que a OpenAI enfrentou nas últimas 24 horas, uma vez que Elon Musk está a tentar processar os fundadores da empresaGreg Brockman e Sam Altman, por terem violado o acordo de fundação da empresa. 

Esta nova ação judicial por direitos de autor alega que o ChatGPT foi treinado com base em jornalismo protegido por direitos de autor sem o necessário crédito ou citação, com pedidos de pelo menos $2.500 por infração.

O apresentação explicaOs sistemas de inteligência artificial (IA) generativa e os grandes modelos linguísticos (LLM) são treinados com base em obras criadas por seres humanos. Os sistemas de IA e os LLMs ingerem grandes quantidades de criatividade humana e utilizam-nas para imitar a forma como os humanos escrevem e falam. Estes conjuntos de treino incluem centenas de milhares, se não milhões, de obras de jornalismo".

Apela também a um estudo recente do Copyleaks, afirmando: "De acordo com o website premiado Copyleaks, quase 60% das respostas fornecidas pelo produto GPT-3.5 dos Réus num estudo conduzido pela Copyleaks continham alguma forma de conteúdo plagiado, e mais de 45% continham texto idêntico a conteúdo pré-existente."

Numa declaração corajosa, John Byrne, diretor executivo e fundador da Raw Story e proprietário da AlterNet, articulou a frustração crescente com as práticas da Big Tech, dizendo: "É altura de as organizações noticiosas lutarem contra as tentativas contínuas da Big Tech de rentabilizar o trabalho de outras pessoas. A Big Tech dizimou o jornalismo. É altura de os editores tomarem uma posição". 

À semelhança de outras acções judiciais, a principal preocupação neste caso é o facto de empresas de IA como a OpenAI terem treinado os seus modelos com base em grandes quantidades de dados que consideram ser de "fonte aberta", "do domínio público" ou de "utilização justa". 

A questão é que estes conceitos são altamente ambíguos. A própria lei dos direitos de autor não foi concebida com o treino de modelos de IA em mente. 

A OpenAI respondeu recentemente ao processo do New York Times, que é provavelmente o mais mediático de todos, alegando que a O NYT pagou a alguém para "piratear" os seus produtos.

A OpenAI argumentou que o NYT utilizou instruções complexas para produzir à força instâncias de violação de direitos de autor. 

No entanto, o NYT ripostou, dizendo que, como as empresas de IA não divulgam os seus dados de treino, as pessoas não têm outra opção senão fazer engenharia reversa dos produtos para os expor.

À medida que a tensão sobre as empresas de IA generativa aumenta, o sector está a aproximar-se de uma encruzilhada.

Junte-se ao futuro


SUBSCREVER HOJE

Claro, conciso e abrangente. Fique a par dos desenvolvimentos da IA com DailyAI

Calças de ganga Sam

Sam é um escritor de ciência e tecnologia que trabalhou em várias startups de IA. Quando não está a escrever, pode ser encontrado a ler revistas médicas ou a vasculhar caixas de discos de vinil.

×

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI

Subscreva a nossa newsletter semanal e receba acesso exclusivo ao último livro eletrónico do DailyAI: 'Mastering AI Tools: Seu guia 2024 para aumentar a produtividade'.

*Ao subscrever a nossa newsletter, aceita a nossa Política de privacidade e o nosso Termos e condições