A qualidade dos geradores de imagens de IA é afetada quando treinados com dados gerados por IA

18 de julho de 2023

Gerador de imagens AI

Um novo estudo mostra que o treino de geradores de imagens de IA com imagens geradas por IA acaba por conduzir a uma redução significativa da qualidade dos resultados. 

Baraniuk e a sua equipa demonstraram como este problemático ciclo de formação de IA afecta as IAs generativas, incluindo StyleGAN e modelos de difusão. Estes estão entre os modelos utilizados para geradores de imagens de IA como Stable Diffusion, DALL-E e MidJourney. 

Na sua experiênciaA equipa treinou as IAs com imagens reais ou geradas por IA. 70.000 rostos humanos reais provenientes do Flickr.

Quando cada IA foi treinada com as suas próprias imagens geradas pela IA, os resultados do gerador de imagens StyleGAN começaram a apresentar padrões visuais distorcidos e ondulados, enquanto os resultados do gerador de imagens de difusão se tornaram mais desfocados.

Em ambos os casos, o treino de IAs em imagens geradas por IA resultou numa perda de qualidade. 

Um dos estudo Os autores, Richard Baraniuk, da Universidade de Rice, no Texas, advertem: "Vai haver um declive escorregadio para a utilização de dados sintéticos, quer de forma intencional quer involuntária".

Gerador de imagens AI
Quanto mais os modelos de IA são treinados em imagens sintéticas, mais desfocados ficam os seus resultados. Fonte: Universidade de Rice.

Embora o declínio na qualidade da imagem tenha sido reduzido através da seleção de imagens de maior qualidade geradas por IA para treino, isto levou a uma perda de diversidade de imagens. 

Os investigadores também tentaram incorporar um conjunto fixo de imagens reais em conjuntos de treino que incluíam principalmente imagens geradas por IA, um método por vezes utilizado para complementar pequenos conjuntos de treino. 

No entanto, isto apenas atrasou o declínio da qualidade da imagem - parece inevitável que quanto mais dados gerados pela IA entrarem nos conjuntos de dados de treino, pior será o resultado. É apenas uma questão de saber quando.

Obtiveram-se resultados razoáveis quando cada IA foi treinada com uma mistura de imagens geradas pela IA e um conjunto de imagens autênticas em constante mudança. Isto ajudou a manter a qualidade e a diversidade das imagens.

É um desafio equilibrar a quantidade com a qualidade - as imagens sintéticas são potencialmente ilimitadas em comparação com as imagens reais, mas a sua utilização tem um custo. 

As IA estão a ficar sem dados

As IA são ávidas de dados, mas os dados autênticos e de alta qualidade são um recurso finito. 

Os resultados desta investigação reflectem estudos semelhantes para a geração de textoem que os resultados da IA tendem a sofrer quando os modelos são treinados em texto gerado pela IA. 

Os investigadores salientam que as organizações mais pequenas, com capacidade limitada para recolher dados autênticos, enfrentam os maiores desafios na filtragem de imagens geradas por IA dos seus conjuntos de dados. 

Além disso, a questão é agravada pelo facto de a Internet estar a ficar inundada de conteúdos gerados por IA, o que torna extremamente difícil determinar o tipo de dados em que os modelos são treinados. 

Sina Alemohammad, da Universidade de Rice, sugere que o desenvolvimento de marcas de água para identificar imagens geradas por IA pode ser útil, mas adverte que marcas de água ocultas podem degradar a qualidade das imagens geradas por IA.

Alemohammad conclui: "É-se condenado se o fizer e condenado se não o fizer. Mas é definitivamente melhor colocar uma marca de água na imagem do que não a colocar."

As consequências a longo prazo da IA que consome os seus resultados são muito debatidas, mas, neste momento, os criadores de IA precisam de encontrar soluções para garantir a qualidade dos seus modelos.

Junte-se ao futuro


SUBSCREVER HOJE

Claro, conciso e abrangente. Fique a par dos desenvolvimentos da IA com DailyAI

Calças de ganga Sam

Sam é um escritor de ciência e tecnologia que trabalhou em várias startups de IA. Quando não está a escrever, pode ser encontrado a ler revistas médicas ou a vasculhar caixas de discos de vinil.

×

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI

Subscreva a nossa newsletter semanal e receba acesso exclusivo ao último livro eletrónico do DailyAI: 'Mastering AI Tools: Seu guia 2024 para aumentar a produtividade'.

*Ao subscrever a nossa newsletter, aceita a nossa Política de privacidade e o nosso Termos e condições