OpenAI håller enligt uppgift på att utveckla DALL-E 3, en uppgraderad version av sin text-till-bild-generator.
Enligt YouTuber MattVidPro AI har cirka 400 personer för närvarande tillgång till en privat testserver för DALL-E 3, och det har läckt ut flera bilder av dess arbete.
En video som delades av MattVidPro AI visade hur DALL-E-testversioner har utvecklats från maj till juli.
Denna utvecklade version av DALL-E verkar kunna generera fotorealistiska bilder och använda specifika tekniker, till exempel penseldrag eller blyertsteckning.
Den outgivna versionen av DALL-E kan också generera bilder som visar gore, blod och upphovsrättsskyddat innehåll, enligt MattVidPro AI - han gav några exempel på bilder som involverar en Snickers-bar och Subway.
Den är också utmärkt för att producera typografi, en akilleshäl för tidigare och nuvarande text-till-bild-modeller.
YouTubern beskrev verktyget som "extremt spännande. Det här blåser allt vi har sett tidigare ur vattnet. Det är helt galet."
Han sade också att "Midjourney kan inte konkurrera på den här nivån. Jag tror inte ens att Midjourney version sex skulle kunna konkurrera på den här nivån."
Kommentatorer på videon lyfter fram MidJourneys dåliga förmåga att följa uppmaningar, något som DALL-E 3 förmodligen tar upp.
Han fortsätter: "Du kan göra exakta kopior av upphovsrättsskyddade konstverk och material. Den kommer att göra upphovsrättsskyddade karaktärer perfekt, logotyper perfekt, helt korrekta avbildningar av kändisar och fullständiga avbildningar av extremt våld" och fortsätter med att säga att modellen ibland producerar olämpliga bilder utan att uttryckligen vara programmerad för att göra det.
"De har helt klart en del finjusteringar och säkerhetsarbete kvar att göra", säger Matt.
Jämförelser med andra AI-system för text-till-bild
Jämförelser mellan den nya DALL-E och Midjourneys senaste modell visade att OpenAI:s innehåll var överlägset, med bättre följsamhet till givna instruktioner och förbättrad bildkvalitet.
Uppgraderingen av DALL-E 3 är dock fortfarande under utveckling och det officiella lanseringsdatumet är fortfarande osäkert. Naturligtvis är den här YouTube-videon utformad för att göra reklam för DALL-E 3, och den offentliga versionen kommer sannolikt att skilja sig mycket från alla "hemliga" testversioner.
När DALL-E 3 väl släpps kommer den sannolikt att ha flera restriktioner, till exempel att bilder som innehåller blod, skräck, upphovsrättsskyddat innehåll och reproduktioner av konstverk inte får förekomma.
Kommer DALL-E 3 att sätta OpenAI tillbaka på toppen av AI-marknaden för bildgenerering?