OpenAI er angiveligt ved at udvikle DALL-E 3, en opgraderet version af sin tekst-til-billede-generator.
Ifølge YouTuberen MattVidPro AI har omkring 400 personer i øjeblikket adgang til en privat testserver til DALL-E 3, og der er blevet lækket flere billeder af dens arbejde.
En video delt af MattVidPro AI viste, hvordan DALL-E-testversionerne har udviklet sig fra maj til juli.
Denne udviklede version af DALL-E ser ud til at være i stand til at generere fotorealistiske billeder og bruge specifikke teknikker som f.eks. penselstrøg eller blyantstegninger.
Den uudgivne version af DALL-E kan ifølge MattVidPro AI også generere billeder, der viser blod og ophavsretligt beskyttet indhold - han gav nogle eksempler på billeder, der involverede en Snickers-bar og Subway.
Den er også fremragende til at producere typografi, en akilleshæl i tidligere og nuværende tekst-til-billede-modeller.
YouTuberen beskrev værktøjet som "ekstremt spændende. Det blæser alt, hvad vi har set før, ud af vandet. Det er vanvittigt."
Han sagde også, at "Midjourney ikke kan konkurrere på dette niveau. Jeg tror ikke engang, at Midjourney version seks ville være i stand til at konkurrere på dette niveau."
Kommentatorer på videoen fremhæver MidJourneys dårlige evne til at følge instruktioner, hvilket DALL-E 3 angiveligt gør noget ved.
Han fortsætter: "Du kan lave nøjagtige kopier af ophavsretligt beskyttede kunstværker og materialer. Den vil lave ophavsretligt beskyttede figurer perfekt, logoer perfekt, helt nøjagtige afbildninger af berømtheder og fuldstændige afbildninger af ekstrem vold" og fortsætter med at sige, at modellen nogle gange producerer upassende billeder uden eksplicit at være programmeret til at gøre det.
"De har tydeligvis noget finjustering og noget sikkerhedsarbejde, der skal gøres," siger Matt.
Sammenligninger med andre tekst-til-billede AI'er
Sammenligninger mellem den nye DALL-E og Midjourneys seneste model viste, at OpenAI's indhold var overlegent med bedre overholdelse af givne anvisninger og forbedret billedkvalitet.
Men DALL-E 3-opgraderingen er stadig under udvikling, og den officielle udgivelsesdato er stadig usikker. Selvfølgelig er denne YouTube-video designet til at hype DALL-E 3, og den offentlige version vil sandsynligvis være meget forskellig fra eventuelle 'hemmelige' testversioner.
Når DALL-E 3 udkommer, vil der sandsynligvis være flere restriktioner, som f.eks. at billeder, der involverer blod, gore, ophavsretligt beskyttet indhold og reproduktioner af kunstværker, ikke må vises.
Vil DALL-E 3 sætte OpenAI tilbage på toppen af markedet for billedgenererende AI?