OpenAI está desarrollando DALL-E 3, una versión mejorada de su generador de texto a imagen.
Según el YouTuber MattVidPro AI, unas 400 personas tienen acceso actualmente a un servidor privado de pruebas de DALL-E 3, y se han filtrado varias imágenes de su trabajo.
Un vídeo compartido por MattVidPro AI muestra cómo han progresado las versiones de prueba de DALL-E de mayo a julio.
Esta versión evolucionada de DALL-E parece ser capaz de generar imágenes fotorrealistas y utilizar técnicas específicas, como las pinceladas o el dibujo a lápiz.
Según MattVidPro AI, la versión inédita de DALL-E también puede generar imágenes con contenido gore, sangriento y protegido por derechos de autor, ya que proporcionó algunos ejemplos de fotos que incluían una barra de Snickers y Subway.
También es excelente para producir tipografía, un talón de Aquiles de los modelos anteriores y actuales de conversión de texto en imagen.
El YouTuber describió la herramienta como "extremadamente emocionante. Es una locura". Es una locura".
También afirmó que "Midjourney no puede competir a este nivel. Ni siquiera creo que la versión seis de Midjourney pueda competir a este nivel".
Los comentaristas del vídeo destacan la escasa capacidad de MidJourney para seguir instrucciones, algo que supuestamente soluciona DALL-E 3.
Y continúa: "Puede hacer copias exactas de obras de arte y materiales protegidos por derechos de autor. Puede hacer perfectamente personajes protegidos por derechos de autor, logotipos, representaciones totalmente exactas de famosos y representaciones de violencia extrema", y añade que el modelo a veces produce imágenes inapropiadas sin estar explícitamente programado para ello.
"Está claro que tienen que hacer algunos ajustes y mejorar la seguridad", afirma Matt.
Comparación con otras IA de conversión de texto en imágenes
Las comparaciones entre el nuevo DALL-E y el último modelo de Midjourney mostraron que el contenido de OpenAI era superior, con una mejor adherencia a las indicaciones dadas y una mejor calidad de imagen.
Sin embargo, la actualización de DALL-E 3 aún está en fase de desarrollo, y su fecha de lanzamiento oficial sigue siendo incierta. Por supuesto, este vídeo de YouTube está diseñado para dar bombo a DALL-E 3, y es probable que la versión pública sea muy diferente de cualquier versión de prueba "secreta".
Una vez estrenada, es probable que DALL-E 3 incluya varias restricciones, como la eliminación de imágenes sangrientas, sangrientas, con derechos de autor y reproducciones de obras de arte.
¿Pondrá DALL-E 3 a OpenAI de nuevo en la cima del mercado de la IA de generación de imágenes?