Por dentro da batalha entre artistas e geradores de imagens com IA

5 de agosto de 2023

Direito da IA

Artistas e criadores estão a pôr em causa os criadores de IA devido a potenciais violações dos direitos de autor.

Escreva uma mensagem num gerador de imagens de IA, como o DALL-E, MidJourney ou Stable Diffusion, e este produzirá uma imagem aparentemente única em poucos segundos.

Apesar da sua aparente singularidade, tssas imagens são geradas a partir de milhares de milhões de outras imagens através do que pode ser descrito como uma técnica complexa de colagem digital.

As imagens de origem são extraídas de fontes "públicas" ou "abertas". 

Se perguntares ao ChatGPT como funciona um gerador de imagens como o DALL-E, ele dirá algo como: "Pensa no DALL-E como um artista digital super avançado, que já viu milhões de imagens e pode desenhar uma nova com base na tua descrição, tentando torná-la o mais exacta possível. Ele faz isso misturando e combinando elementos que aprendeu com suas 'observações' anteriores."

É um pouco como percorrer as galerias de arte do mundo e tirar fotografias de cada obra - só que não pode ser expulso. 

A Internet não tem seguranças e câmaras a vigiar as pessoas para impedir a pirataria ou o roubo, e a prática de data scraping - que envolve a recolha de dados da Internet com o serviço de bots - sempre ocupou um território jurídico nebuloso. 

Os artistas argumentam que treinar IAs de texto para imagem em conjuntos de dados públicos é equivalente ao maior roubo de arte do mundo.

Como é que os detectores de IA fazem os artistas sentir-se?

Para alguns artistas de sucesso, cujo trabalho foi copiado milhares - ou mesmo milhões de vezes - os impactos da arte gerada por IA tornaram difícil distinguir entre o seu próprio trabalho e as cópias de IA.

As diferenças estéticas são simplesmente demasiado pequenas, provavelmente porque as imagens populares aparecem prolificamente nos conjuntos de dados. 

Entre eles está Greg Rutowski, que disse: "O meu trabalho foi mais utilizado na IA do que o de Picasso". 

Greg Rutowski
O trabalho de Greg Rutowski foi copiado milhares de vezes: Fonte: MIT.

As ilustrações de fantasia de Rutowki estão presentes em franchises como Dungeons and Dragons e Magic: The Gathering e podem ser reproduzidas através de geradores de texto-imagem, bastando acrescentar o nome do artista ao pedido, por exemplo, "Criar um dragão a lutar contra um ogre ao estilo de Greg Rutowski". 

Ele disse à BBCNo primeiro mês em que o descobri, apercebi-me de que iria afetar claramente a minha carreira e que não seria capaz de reconhecer e encontrar os meus próprios trabalhos na Internet", acrescentando: "Os resultados serão associados ao meu nome, mas não será a minha imagem. Não será criada por mim. Por isso, vai criar confusão para as pessoas que estão a descobrir as minhas obras".

Tudo aquilo em que trabalhámos durante tantos anos foi-nos retirado tão facilmente com a IA". 

A última afirmação acerta em cheio no alvo, uma vez que a reprodução pela IA de obras complexas e talentosas demora meros segundos, o que significa que não só o trabalho dos artistas se torna redundante, como também se perdem as competências utilizadas para as criar.

A humanidade lA falta de competências e conhecimentos autênticos é um dos riscos mais prementes da IA, designado por "enfraquecimento,", ilustrada pelo filme da Disney WALL-E, em que os humanos perdem a capacidade de se moverem devido à tecnologia. 

Outro artista que se pronunciou sobre o facto de a IA reproduzir as suas obras é Kelly McKernan, uma ilustradora sediada no Tennessee que descobriu que mais de 50 peças do seu trabalho artístico tinham sido listadas como dados de treino na Rede Aberta de Inteligência Artificial em Grande Escala (LAION).

Pode pesquisar cerca de 5,8 mil milhões de imagens encontradas em conjuntos de treino de IA com a ferramenta "Fui treinado?"Foi assim que McKernan se deparou com o seu trabalho. 

Fui treinado? oferece uma facilidade para pesquisar bases de dados de imagens de fonte aberta.

A LAION é uma organização sem fins lucrativos que cria modelos e conjuntos de dados de fonte aberta, muitos dos quais foram utilizados para treinar modelos de conversão de texto em imagem de alto nível, incluindo o Stable Diffusion e o Imagen.

"De repente, todos estes quadros com os quais tinha uma relação pessoal e uma viagem passaram a ter um novo significado, o que mudou a minha relação com essas obras de arte", disse McKernan.

As batalhas legais estão em curso 

McKernan, juntamente com as colegas artistas Sarah Anderson e Karla Ortiz, interpôs uma ação judicial contra a Stability AI, a DeviantArt e a Midjourney.

O seu processo junta-se a uma série de acções judiciais contra empresas de IA, tanto de escritores como de artistas visuais. 

As empresas de maior dimensão também estão a processar ou planeiam processar os criadores de IA, incluindo a Getty Images, que alegou que a Stability AI tinha copiado e processado ilegalmente 12 milhões das suas imagens sem autorização.

McKernan afirmou: "Atualmente, os direitos de autor só podem ser aplicados à minha imagem completa. Espero que [a ação judicial] incentive a proteção dos artistas para que a IA não possa ser utilizada para nos substituir. Se ganharmos, espero que muitos artistas sejam pagos. É trabalho gratuito e algumas pessoas estão a lucrar com a exploração".

O estilo de McKernan, como se vê abaixo, foi solicitado em cerca de 12.000 prompts do MidJourney. 

 

Ver esta publicação no Instagram

 

Uma publicação partilhada por Kelly McKernan (@kelly_mckernan)

Uma questão fundamental é o facto de a lei dos direitos de autor não ter sido concebida para a era da IA.

Liam Budd, do sindicato das artes do espetáculo e do entretenimento Equity, defendeu a atualização das leis que reflectem as potenciais oportunidades de negócio que a IA generativa oferece. 

Ele declarado"Precisamos de mais clareza na lei e estamos a fazer campanha para que a Lei dos Direitos de Autor seja actualizada".

Em resposta à onda crescente de infracções aos direitos de autor no âmbito da IA, várias jurisdições, como a UE, propuseram que os criadores de IA revelem qualquer material protegido por direitos de autor utilizado para treino. 

Será isso suficiente? Será que os criadores de IA já mostraram que é provável que consigam safar-se?

Afinal, a maior parte destes conjuntos de dados já estão reunidos e as empresas de IA podem argumentar que estão apenas a atualizar modelos para contornar a necessidade de declarar material protegido por direitos de autor.

As acções judiciais têm uma base jurídica sólida?

Esta atual ronda de acções judiciais colectivas gira, em grande parte, em torno de dois argumentos. 

  • Em primeiro lugar, a alegação de que as empresas violaram os direitos de autor dos artistas ao utilizarem as suas obras sem autorização. 
  • Em segundo lugar, a alegação de que os resultados da IA são essencialmente conteúdos derivados devido à sua inclusão nos dados de formação. 

A aplicação destes argumentos difere a nível mundial, nomeadamente nos EUA, onde as leis de "utilização legítima" são geralmente mais liberais do que na UE. Este facto complica ainda mais o panorama dos direitos de autor da IA. Se as empresas estiverem a operar no Reino Unido, por exemplo, poderão ter mais dificuldade em argumentar a "utilização justa".

Além disso, estão a ser processadas empresas de IA generativa e não as entidades que compilam os conjuntos de dados, como a LAION no caso da MidJourney. Eliana Torres, advogada de propriedade intelectual da sociedade de advogados Nixon Peabody, salienta que, se a LAION criou o conjunto de dados, a alegada infração ocorreu nesse momento e não quando o conjunto de dados foi utilizado para treinar os modelos.

Por outro lado, provar que as obras geradas por IA são reproduções de obras originais é um desafio devido à natureza complexa da IA, que utiliza o processamento algorítmico para decompor e voltar a montar imagens.

As entidades reguladoras foram apanhadas desprevenidas pelas implicações legais da IA generativa e, embora estejam a ser desenvolvidas soluções provisórias como filtros automatizados e disposições de auto-exclusão para os artistas, estas podem não ser suficientes. 

Até que os juízes cheguem a veredictos sobre casos individuais, o que pode levar meses, as empresas de IA generativa estão a expor-se a riscos legais significativos em muitas jurisdições. 

A história indica que a lei dos direitos de autor pode adaptar-se a novas tecnologias, mas até que surja um consenso, tanto os artistas como os criadores de IA estão muito no escuro. 

Os juízes travam as acções judiciais

Até agora, os juízes têm dado aos artistas poucos motivos para estarem optimistas. 

Por exemplo, o juiz distrital dos EUA William Orrick pôs em dúvida a ação judicial Kelly McKernan.

Segundo o juiz OrrickPara o advogado, McKernan e os outros queixosos tinham de "fornecer mais factos" sobre a alegada violação dos direitos de autor e diferenciar claramente as suas queixas contra cada empresa (Stability AI, DeviantArt e Midjourney). 

Orrick observou que os sistemas tinham sido treinados em "cinco mil milhões de imagens comprimidas", pelo que os artistas têm de apresentar provas mais fortes de que as suas obras estavam especificamente envolvidas na alegada violação de direitos de autor. A sítio Web que acompanha esta ação judicial carregou recentemente informações técnicas sobre o modo como estes modelos funcionam, interpolando o conteúdo das imagens no seu conjunto de treino. 

O processo está a ser representado pelo Escritório de advocacia Joseph Saverique também está a representar pelo menos 5 outros casos semelhantes contra empresas de IA.

E, mais uma vez, os direitos de autor são potencialmente infringidos na recolha de dados e não na sua geração. 

A secção 1202(b) da Lei dos Direitos de Autor do Milénio Digital dos Estados Unidos "diz respeito a 'cópias ... de uma obra' idênticas - e não a fragmentos e adaptações dispersas", pelo que o argumento de que as obras são "copiadas" pelo processo do modelo de IA é potencialmente frágil. 

As opiniões de Orrick também levantam questões sobre a responsabilidade de empresas como a MidJourney e a DeviantArt, que incorporam a tecnologia Stable Diffusion da Stability AI nos seus próprios sistemas de IA generativa. 

ISe os criadores de IA, como a OpenAI, a Meta, etc., forem responsabilizados por violarem os direitos de autor dos artistas, ficam vulneráveis a outras acções judiciais. 

Os autores e escritores também estão a lançar litígios 

Noutro ação judicial recenteA comediante e autora norte-americana Sarah Silverman e os autores Christopher Golden e Richard Kadrey alegam que as suas palavras foram ilegalmente utilizadas para treinar modelos de IA como o ChatGPT e o LLaMA.

A ação judicial faz reivindicações paralelas às apresentadas pelos artistas plásticos, mas desta vez as IAs são treinadas com base em dados de texto públicos. 

O processo alega que o ChatGPT foi capaz de resumir com precisão livros como "The Bedwetter" de Silverman, "Ararat" de Golden e "Sandman Slim" de Kadrey. Crucialmente, o nível de detalhe fornecido pelos resumos não pode ser explicado por excertos dos livros carregados na Wikipedia ou em sites de livrarias. 

Os queixosos acusam a OpenAI e a Meta de utilizarem livros protegidos por direitos de autor de "bibliotecas-sombra" sem consentimento. 

As bibliotecas-sombra, como a Bibliotik, a Library Genesis e a Z-Library, alojam grandes quantidades de informação copiada ilegalmente. 

Biblioteca
A Library Genesis já tinha sido alvo de uma ação judicial e foi-lhe ordenado que encerrasse o seu sítio Web, mas os organizadores limitaram-se a abrir novos domínios. Fonte: Wikipédia.

Embora seja evidente que as empresas de IA monetizaram produtos com a ajuda de trabalhos protegidos por direitos de autor, têm várias camadas de proteção, incluindo a natureza inerentemente complexa dos seus modelos e o espaço idiossincrático que ocupam na paisagem moral, ética e jurídica.

O que é que os tribunais têm de decidir? 

Enquanto os reguladores ainda estão a deliberar sobre as regras relativas à IA, os juízes poderão ter a primeira oportunidade de moldar o futuro panorama dos direitos de autor.

Isto pode resultam numa manta de retalhos de legislação confinada às especificidades de cada caso e à jurisdição em que foi julgado.

Atualmente, há muitas perguntas a responder, incluindo: 

P1: A formação de um modelo em material protegido por direitos de autor requer uma licença?

  • Utilização justa vs. licenciamento: Os tribunais poderão ter de decidir se a cópia temporária de dados durante a formação se enquadra na "utilização justa", o que permitiria a utilização sem uma licença. Isto pode depender de factores como o objetivo da cópia, a natureza do trabalho protegido por direitos de autor, a quantidade e substancialidade da parte utilizada e o efeito no valor de mercado do trabalho protegido por direitos de autor.
  • Perspectivas internacionais: As diferentes jurisdições podem ter posições diferentes sobre esta matéria. Por exemplo, a diretiva da UE relativa aos direitos de autor pode ser interpretada de forma diferente da lei dos EUA relativa aos direitos de autor.

Q2: Os resultados da IA generativa infringem os direitos de autor dos materiais em que o modelo foi treinado?

  • Determinação do trabalho derivado: A produção geradora é simplesmente uma transformação ou cria efetivamente uma obra derivada que viola os direitos de autor? Esta questão pode exigir uma análise complexa da semelhança e da criatividade.
  • Questões de responsabilidade: Se houver infração, quem é responsável? O criador da IA? O utilizador da IA? O distribuidor? 

Q3: A IA generativa viola as restrições relativas à remoção, alteração ou falsificação de informações de gestão de direitos de autor?

  • Casos específicos: Poderá ser necessária a análise de algoritmos específicos, como o Stable Diffusion, para determinar se as obras geradas podem reproduzir ou manipular acidentalmente marcas de água ou outras informações sobre direitos de autor.
  • Infração intencional vs. acidental: Os tribunais poderão ter de determinar se houve intenção de remover ou alterar informações sobre direitos de autor ou se foi uma consequência não intencional do funcionamento da IA.

P4: Gerar um trabalho ao estilo de alguém viola os direitos dessa pessoa?

  • Definição do direito de publicidade: O direito de publicidade varia consoante a jurisdição. Os tribunais poderão ter de interpretar se a criação de obras no estilo de alguém equivale a utilizar a sua imagem ou identidade.
  • Utilização comercial vs. não comercial: A aplicação pode ser diferente consoante os resultados da IA sejam ou não utilizados para fins comerciais.

P5: Como é que as licenças de fonte aberta se aplicam ao treino de modelos de IA e à distribuição dos resultados?

  • Compreender o licenciamento de fonte aberta: Os tribunais poderão ter de determinar a forma como as licenças de fonte aberta se aplicam aos dados de treino da IA e aos resultados gerados.

Neste momento, falta-nos uma coisa: uma decisão. Neste momento, seria insensato prever se a recolha gratuita de dados continuará a ser aceitável. Se os criadores encontrarem uma brecha na armadura legal da indústria da IA, os danos podem ser consideráveis. Mas está a parecer um grande "se".

Quando os acórdãos começarem a ser filtrados e nos aproximarmos da entrada em vigor da regulamentação, a direção futura da IA deverá tornar-se mais clara - até ao próximo conjunto de desafios.

Junte-se ao futuro


SUBSCREVER HOJE

Claro, conciso e abrangente. Fique a par dos desenvolvimentos da IA com DailyAI

Calças de ganga Sam

Sam é um escritor de ciência e tecnologia que trabalhou em várias startups de IA. Quando não está a escrever, pode ser encontrado a ler revistas médicas ou a vasculhar caixas de discos de vinil.

×

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI

Subscreva a nossa newsletter semanal e receba acesso exclusivo ao último livro eletrónico do DailyAI: 'Mastering AI Tools: Seu guia 2024 para aumentar a produtividade'.

*Ao subscrever a nossa newsletter, aceita a nossa Política de privacidade e o nosso Termos e condições