OpenAI is naar verluidt bezig met de ontwikkeling van DALL-E 3, een verbeterde versie van zijn tekst-naar-beeld generator.
Volgens YouTuber MattVidPro AI hebben ongeveer 400 mensen op dit moment toegang tot een privé testserver voor DALL-E 3 en zijn er verschillende beelden uitgelekt van het werk.
Een video gedeeld door MattVidPro AI laat zien hoe DALL-E testversies zijn gevorderd van mei tot juli.
Deze geëvolueerde versie van DALL-E lijkt fotorealistische beelden te kunnen genereren en specifieke technieken te kunnen gebruiken, zoals penseelstreken of potloodtekenen.
De nog niet uitgebrachte versie van DALL-E kan volgens MattVidPro AI ook afbeeldingen genereren met gore, bloed en auteursrechtelijk beschermde inhoud - hij gaf een aantal voorbeelden van foto's met een Snickers-reep en Subway.
Het is ook uitstekend in het produceren van typografie, een achilleshiel van vroegere en huidige tekst-naar-beeld modellen.
De YouTuber omschreef de tool als "extreem opwindend. Dit blaast alles wat we eerder hebben gezien uit het water. Het is waanzinnig."
Hij verklaarde ook dat "Midjourney niet kan concurreren op dit niveau. Ik denk zelfs niet dat Midjourney versie zes op dit niveau zou kunnen concurreren."
Commentatoren op de video benadrukken het slechte vermogen van MidJourney om zich aan prompts te houden, wat DALL-E 3 naar verluidt aanpakt.
Hij vervolgt: "Je kunt exacte kopieën maken van auteursrechtelijk beschermde kunstwerken en materialen. Het kan auteursrechtelijk beschermde personages perfect namaken, logo's perfect namaken, volledig accurate afbeeldingen van beroemdheden namaken en extreem geweld volledig namaken" en zegt verder dat het model soms ongepast beeldmateriaal produceert zonder dat het daar expliciet voor geprogrammeerd is.
"Ze hebben duidelijk nog wat fine-tuning en veiligheidswerk te doen," zegt Matt.
Vergelijkingen met andere tekst-naar-beeld AI's
Uit vergelijkingen tussen de nieuwe DALL-E en het nieuwste model van Midjourney bleek dat de inhoud van OpenAI superieur was, met een betere opvolging van gegeven aanwijzingen en een betere beeldkwaliteit.
De DALL-E 3 upgrade is echter nog in ontwikkeling en de officiële releasedatum blijft onzeker. Natuurlijk is deze YouTube-video bedoeld om DALL-E 3 te hypen, en de openbare versie zal waarschijnlijk heel anders zijn dan eventuele 'geheime' testversies.
Zodra DALL-E 3 wordt uitgebracht, zal het waarschijnlijk verschillende beperkingen bevatten, zoals het uitsluiten van beelden met bloed, gore, auteursrechtelijk beschermde inhoud en reproducties van kunstwerken.
Zal DALL-E 3 OpenAI terug aan de top van de AI-markt voor beeldgeneratie brengen?