Os investigadores treinam um modelo para criar imagens sem "ver" obras protegidas por direitos de autor

21 de maio de 2024

  • Os investigadores da Universidade do Texas treinaram um modelo de imagem em dados corrompidos
  • Apesar de as imagens estarem distorcidas e fragmentadas, continua a ter um desempenho admirável
  • Isto mostra como os modelos de geração de imagens podem aprender sem dados de direitos de autor
Geração de imagens

Os investigadores da Universidade do Texas em Austin desenvolveram uma estrutura inovadora para treinar modelos de IA em imagens fortemente corrompidas. 

Conhecido como Ambient Diffusion, este método permite aos modelos de IA "inspirarem-se" nas imagens sem copiando-os diretamente.

Modelos convencionais de texto-imagem utilizados por DALL-EMidjourney e Stable Diffusion correm o risco de violar direitos de autor porque são treinados em conjuntos de dados que incluem imagens protegidas por direitos de autor, levando-os por vezes a replicar inadvertidamente essas imagens. 

O Ambient Diffusion inverte isso ao treinar modelos com dados deliberadamente corrompidos.

No estudoA equipa de investigação, que inclui Alex Dimakis e Giannis Daras do departamento de Engenharia Eletrotécnica e de Computadores da UT Austin e Constantinos Daskalakis da MITtreinou um modelo Stable Diffusion XL num conjunto de dados de 3.000 imagens de celebridades. 

Inicialmente, observou-se que os modelos treinados em dados limpos copiavam descaradamente os exemplos de treino. 

No entanto, quando os dados de treino foram corrompidos - mascarando aleatoriamente até 90% dos pixéis - o modelo continuou a produzir imagens únicas e de alta qualidade.

Isto significa que a IA nunca é exposta a versões reconhecíveis das imagens originais, impedindo-a de as copiar.

"A nossa estrutura permite controlar o compromisso entre a memorização e o desempenho". explicou Giannis Daras, um estudante licenciado em ciências informáticas que liderou o trabalho. 

"À medida que o nível de corrupção encontrado durante o treino aumenta, a memorização do conjunto de treino diminui."

Aplicações científicas e médicas

As utilizações da difusão ambiente vão para além da resolução de questões de direitos de autor. 

De acordo com o Professor Adam Klivans, um colaborador do projeto, "o quadro poderia revelar-se útil também para aplicações científicas e médicas. Isto aplicar-se-ia basicamente a qualquer investigação em que seja dispendioso ou impossível dispor de um conjunto completo de dados não corrompidos, desde a imagiologia de buracos negros a certos tipos de exames de ressonância magnética".

Isto é particularmente benéfico em domínios com acesso limitado a dados não corrompidos, tais como astronomia e física das partículas

Nestes e noutros domínios, os dados podem ser extremamente ruidosos, de má qualidade ou escassos, o que significa que os dados significativos são em grande número ultrapassados por dados inúteis. Ensinar os modelos a utilizar dados sub-óptimos de forma mais eficiente seria útil neste caso.

Se a abordagem de difusão ambiente fosse mais aperfeiçoada, as empresas de IA poderiam criar modelos funcionais de texto para imagem, respeitando os direitos dos criadores de conteúdos originais e evitando problemas jurídicos.

Embora isso não resolva os receios de que as ferramentas de imagem de IA reduzam o leque de trabalho dos verdadeiros artistas, pelo menos protegeria as suas obras de serem acidentalmente reproduzidas em resultados.

Junte-se ao futuro


SUBSCREVER HOJE

Claro, conciso e abrangente. Fique a par dos desenvolvimentos da IA com DailyAI

Calças de ganga Sam

Sam é um escritor de ciência e tecnologia que trabalhou em várias startups de IA. Quando não está a escrever, pode ser encontrado a ler revistas médicas ou a vasculhar caixas de discos de vinil.

×

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI

Subscreva a nossa newsletter semanal e receba acesso exclusivo ao último livro eletrónico do DailyAI: 'Mastering AI Tools: Seu guia 2024 para aumentar a produtividade'.

*Ao subscrever a nossa newsletter, aceita a nossa Política de privacidade e o nosso Termos e condições