OpenAI starebbe sviluppando DALL-E 3, una versione aggiornata del suo generatore di testo-immagine.
Secondo lo YouTuber MattVidPro AI, circa 400 persone hanno attualmente accesso a un server di test privato per DALL-E 3 e sono trapelate diverse immagini del suo lavoro.
Un video condiviso da MattVidPro AI ha mostrato i progressi delle versioni di prova di DALL-E da maggio a luglio.
Questa versione evoluta di DALL-E sembra essere in grado di generare immagini fotorealistiche e di utilizzare tecniche specifiche, come pennellate o disegni a matita.
Secondo MattVidPro AI, la versione inedita di DALL-E può anche generare immagini che ritraggono gore, sangue e contenuti protetti da copyright, fornendo alcuni esempi di foto che coinvolgono una barretta Snickers e Subway.
È anche eccellente nella produzione della tipografia, un tallone d'Achille dei modelli text-to-image passati e presenti.
Lo YouTuber ha descritto lo strumento come "estremamente eccitante". Questo strumento fa esplodere tutto ciò che abbiamo visto prima. È pazzesco".
Ha inoltre dichiarato che "Midjourney non può competere a questo livello. Non credo nemmeno che la versione sei di Midjourney sia in grado di competere a questo livello".
I commentatori del video sottolineano la scarsa capacità di MidJourney di aderire alle richieste, che DALL-E 3 dovrebbe risolvere.
E continua: "È possibile realizzare copie esatte di opere d'arte e materiali protetti da copyright. Può riprodurre perfettamente i personaggi protetti da copyright, i loghi, le rappresentazioni completamente accurate delle celebrità e le rappresentazioni di violenza estrema" e continua dicendo che il modello a volte produce immagini inappropriate senza essere esplicitamente programmato per farlo.
"È chiaro che devono fare delle messe a punto e delle operazioni di sicurezza", dice Matt.
Confronto con altre IA testo-immagine
Il confronto tra il nuovo DALL-E e l'ultimo modello di Midjourney ha dimostrato che il contenuto di OpenAI è superiore, con una migliore aderenza alle indicazioni fornite e una migliore qualità delle immagini.
Tuttavia, l'aggiornamento di DALL-E 3 è ancora in fase di sviluppo e la sua data di uscita ufficiale rimane incerta. Naturalmente, questo video su YouTube è stato progettato per pubblicizzare DALL-E 3, e la versione pubblica sarà probabilmente molto diversa da qualsiasi versione di prova "segreta".
Una volta uscito, DALL-E 3 sarà probabilmente soggetto a diverse restrizioni, come l'eliminazione delle immagini che coinvolgono sangue, gore, contenuti protetti da copyright e riproduzioni di opere d'arte.
DALL-E 3 riporterà OpenAI in cima al mercato dell'AI per la generazione di immagini?