OpenAI er angivelig i ferd med å utvikle DALL-E 3, en oppgradert versjon av tekst-til-bilde-generatoren.
Ifølge YouTuber MattVidPro AI har rundt 400 personer for øyeblikket tilgang til en privat testserver for DALL-E 3, og det har blitt lekket flere bilder av arbeidet.
En video delt av MattVidPro AI viste hvordan DALL-E testversjoner har utviklet seg fra mai til juli.
Denne videreutviklede versjonen av DALL-E ser ut til å kunne generere fotorealistiske bilder og bruke spesifikke teknikker, for eksempel penselstrøk eller blyanttegning.
Den uutgitte versjonen av DALL-E kan også generere bilder som viser blod, blod og opphavsrettsbeskyttet innhold, ifølge MattVidPro AI - han ga noen eksempler på bilder som involverer en Snickers-bar og Subway.
Den er også utmerket til å produsere typografi, en akilleshæl hos tidligere og nåværende tekst-til-bilde-modeller.
YouTuberen beskrev verktøyet som "ekstremt spennende. Dette blåser alt vi har sett før ut av vannet. Det er helt vanvittig."
Han uttalte også at "Midjourney kan ikke konkurrere på dette nivået. Jeg tror ikke engang Midjourney versjon seks ville vært i stand til å konkurrere på dette nivået."
Kommentatorer på videoen fremhever MidJourneys dårlige evne til å følge beskjeder, noe DALL-E 3 angivelig tar tak i.
Han fortsetter: "Du kan lage eksakte kopier av opphavsrettsbeskyttede kunstverk og materialer. Den kan lage perfekte kopier av opphavsrettsbeskyttede figurer, logoer, helt nøyaktige avbildninger av kjendiser og ekstreme voldsskildringer", og fortsetter med å si at modellen noen ganger produserer upassende bilder uten at den eksplisitt er programmert til å gjøre det.
"De har helt klart en del finjusteringer og en del sikkerhetsarbeid å gjøre", sier Matt.
Sammenligninger med andre AI-systemer for tekst-til-bilde
Sammenligninger mellom den nye DALL-E og Midjourneys nyeste modell viste at OpenAIs innhold var overlegent, med bedre etterlevelse av gitte instruksjoner og bedre bildekvalitet.
DALL-E 3-oppgraderingen er imidlertid fortsatt under utvikling, og den offisielle lanseringsdatoen er fortsatt usikker. Denne YouTube-videoen er selvfølgelig laget for å hype DALL-E 3, og den offentlige versjonen vil sannsynligvis være svært forskjellig fra eventuelle "hemmelige" testversjoner.
Når DALL-E 3 slippes, vil den sannsynligvis inneholde flere restriksjoner, for eksempel at bilder som involverer blod, blodige scener, opphavsrettsbeskyttet innhold og reproduksjoner av kunstverk, må fjernes.
Vil DALL-E 3 sette OpenAI tilbake på toppen av markedet for bildegenererende AI?