La calidad de los generadores de imágenes de IA se resiente cuando se entrenan con datos generados por la IA

18 de julio de 2023

Generador de imágenes AI

Un nuevo estudio demuestra que entrenar a los generadores de imágenes de IA con imágenes generadas por la IA acaba provocando una reducción significativa de la calidad del resultado. 

Baraniuk y su equipo demostraron cómo este problemático bucle de entrenamiento de IA afecta a las IA generativas, incluidos StyleGAN y los modelos de difusión. Estos son algunos de los modelos que se utilizan para los generadores de imágenes de IA como Stable Diffusion, DALL-E y MidJourney. 

En su experimentoEl equipo entrenó a las IA con imágenes reales o generadas por ellas. 70.000 rostros humanos reales extraídos de Flickr.

Cuando cada IA se entrenó con sus propias imágenes generadas por la IA, los resultados del generador de imágenes StyleGAN empezaron a mostrar patrones visuales distorsionados y ondulados, mientras que los resultados del generador de imágenes de difusión se volvieron más borrosos.

En ambos casos, el entrenamiento de las IAs en imágenes generadas por ellas supuso una pérdida de calidad. 

Uno de los estudiar autores, Richard Baraniuk, de la Universidad Rice de Texas, advierte: "Va a haber una pendiente resbaladiza hacia el uso de datos sintéticos, ya sea a sabiendas o sin querer".

Generador de imágenes AI
Cuanto más se entrenan los modelos de IA con imágenes sintéticas, más borrosos son sus resultados. Fuente: Universidad de Rice.

Aunque la disminución de la calidad de las imágenes se redujo seleccionando para el entrenamiento imágenes de mayor calidad generadas por la IA, esto provocó una pérdida de diversidad de imágenes. 

Los investigadores también probaron a incorporar un conjunto fijo de imágenes reales a conjuntos de entrenamiento que incluían principalmente imágenes generadas por IA, un método que a veces se utiliza para complementar conjuntos de entrenamiento pequeños. 

Sin embargo, esto sólo retrasó el declive de la calidad de la imagen: parece inevitable que cuantos más datos generados por la IA entren en los conjuntos de datos de entrenamiento, peor será el resultado. Sólo es cuestión de tiempo.

Se obtuvieron resultados razonables cuando cada IA se entrenó con una mezcla de imágenes generadas por la IA y un conjunto de imágenes auténticas en constante cambio. Esto ayudó a mantener la calidad y diversidad de las imágenes.

Es difícil equilibrar cantidad y calidad: las imágenes sintéticas son potencialmente ilimitadas en comparación con las reales, pero su uso tiene un coste. 

Las IA se quedan sin datos

Las IA están ávidas de datos, pero los datos auténticos y de alta calidad son un recurso finito. 

Los resultados de esta investigación se hacen eco estudios similares para la generación de textosdonde los resultados de la IA tienden a resentirse cuando los modelos se entrenan con texto generado por la IA. 

Los investigadores destacan que las organizaciones más pequeñas con capacidad limitada para recopilar datos auténticos son las que se enfrentan a mayores dificultades para filtrar las imágenes generadas por IA de sus conjuntos de datos. 

Además, el problema se agrava porque Internet se está inundando de contenidos generados por IA, lo que dificulta enormemente determinar el tipo de datos con los que se entrenan los modelos. 

Sina Alemohammad, de la Universidad Rice, sugiere que el desarrollo de marcas de agua para identificar las imágenes generadas por IA podría ayudar, pero advierte de que pasar por alto las marcas de agua ocultas puede degradar la calidad de las imágenes generadas por IA.

Alemohammad concluye: "Estás condenado si lo haces y condenado si no lo haces. Pero sin duda es mejor poner una marca de agua en la imagen que no hacerlo".

Las consecuencias a largo plazo del consumo de los resultados de la IA son objeto de acalorados debates, pero ahora mismo, los desarrolladores de IA necesitan encontrar soluciones para garantizar la calidad de sus modelos.

Únete al futuro


SUSCRÍBETE HOY

Claro, conciso y completo. Conozca los avances de la IA con DailyAI

Sam Jeans

Sam es un escritor de ciencia y tecnología que ha trabajado en varias startups de IA. Cuando no está escribiendo, se le puede encontrar leyendo revistas médicas o rebuscando en cajas de discos de vinilo.

×

PDF GRATUITO EXCLUSIVO
Adelántese con DailyAI

Suscríbase a nuestro boletín semanal y reciba acceso exclusivo al último eBook de DailyAI: 'Mastering AI Tools: Su guía 2024 para mejorar la productividad'.

*Al suscribirse a nuestro boletín de noticias, acepta nuestra política de privacidad. Política de privacidad y nuestro Condiciones generales