OpenAI ha anunciado que DALL-E 3, su generador de imágenes de IA actualizado, se encuentra en fase de investigación previa y ofrece mejoras significativas con respecto a DALL-E 2.
Una de las grandes mejoras que promete OpenAI es una mayor atención a los matices en la redacción de las instrucciones. Con DALL-E 2, a menudo es necesaria una ingeniosa ingeniería de instrucciones para obtener la imagen deseada, pero DALL-E 3 será más intuitivo y responderá mejor a las palabras que incluyas.
Mientras que DALL-E 2 funciona en su propia plataforma, DALL-E 3 se integrará con ChatGPT. Los usuarios pueden utilizar ChatGPT para tomar una idea y generar una sugerencia detallada para una imagen, que DALL-E 3 generará a continuación.
¿Quieres modificar la imagen o hacer variaciones de ella? Sólo tienes que decirle a ChatGPT lo que quieres. Este proceso de creación de ida y vuelta está muy bien ilustrado en el vídeo de demostración de OpenAI.
Los ejemplos utilizados por OpenAI muestran que, ante la misma pregunta, DALL-E 3 genera imágenes mucho mejores que su predecesor.
Uno de los grandes avances de la última iteración es su capacidad para manejar texto en imágenes. Los generadores de imágenes de IA han sido muy malos a la hora de añadir texto a las imágenes, pero DALL-E 3 parece hacerlo realmente bien, como se ilustra en esta imagen.
Nuestro nuevo modelo de conversión de texto en imagen, DALL-E 3, puede traducir peticiones matizadas en imágenes extremadamente detalladas y precisas.
Próximamente en ChatGPT Plus y Enterprise, que le ayudarán a crear ideas sorprendentes para darles vida:https://t.co/jDXHGNmarT pic.twitter.com/aRWH5giBPL
- OpenAI (@OpenAI) 20 de septiembre de 2023
La imagen es sencilla, pero que la IA inserte el texto con precisión cambia las reglas del juego.
La seguridad ante todo
Cuando DALL-E se lanzó por primera vez fue criticado por ser tendencioso y permitir a los usuarios crear imágenes explícitas fotorrealistas. También se plantearon cuestiones éticas y legales relacionadas con la imitación de artistas o la creación de imágenes de figuras populares.
Con DALL-E 3, OpenAI ha establecido una serie de barreras para mantener la herramienta en el lado correcto de estas cuestiones.
OpenAI afirma que ha "tomado medidas para limitar la capacidad de DALL-E 3 de generar contenidos violentos, para adultos o que inciten al odio". Si utilizas el nombre de un personaje público en tu solicitud, la herramienta rechazará tu petición de generar la imagen.
OpenAI contrató a miembros del equipo rojo para que realizaran pruebas de estrés en DALL-E 3 con el fin de comprobar la eficacia de sus esfuerzos por reducir la parcialidad, la propaganda y la desinformación.
Los derechos de autor y la protección de la propiedad intelectual son temas de actualidad, y muchos artistas se quejan de las derivaciones de sus obras generadas por la IA. DALL-E 3 ha sido diseñado para rechazar las peticiones de generar imágenes al estilo de un artista vivo.
Los artistas también pueden enviar un formulario para pedir a OpenAI que elimine sus imágenes del conjunto de datos de entrenamiento de DALL-E 3.
A medida que mejoran las imágenes generadas por IA, resulta cada vez más difícil saber si una imagen se ha creado con IA o no. OpenAI afirma que está probando una herramienta que ayudará a identificar las imágenes creadas con DALL-E 3, pero no ofrece más detalles.
Si eres usuario de ChatGPT Plus, podrás jugar con DALL-E 3 dentro de unas semanas, pero aún no se sabe cuándo saldrá a la venta de forma gratuita.