OpenAI har meddelat att DALL-E 3, dess uppgraderade AI-bildgenerator, är i forskningsförhandsgranskning och erbjuder betydande förbättringar jämfört med DALL-E 2.
En av de stora förbättringarna som OpenAI utlovar är att man ska vara mer lyhörd för nyanser i hur uppmaningar formuleras. Med DALL-E 2 krävs det ofta en del smart teknik för att få den bild du vill ha, men DALL-E 3 kommer att vara mer intuitiv och lyhörd för de ord du inkluderar.
Medan DALL-E 2 arbetar på sin egen plattform kommer DALL-E 3 att integreras med ChatGPT. Användare kan använda ChatGPT för att ta en idé och generera en detaljerad uppmaning till en bild, som DALL-E 3 sedan genererar.
Vill du justera bilden eller göra variationer av den? Berätta bara för ChatGPT vad du vill ha. Denna fram-och-tillbaka-skapande process illustreras snyggt i OpenAI:s demovideo.
De exempel som OpenAI använde visade att DALL-E 3 genererar mycket bättre bilder än sin föregångare när samma fråga ställs.
Ett av de stora framstegen i den senaste versionen är dess förmåga att hantera text i bilder. AI-bildgeneratorer har varit notoriskt dåliga på att lägga till text i bilder men DALL-E 3 verkar göra det riktigt bra, vilket illustreras i den här bilden.
Vår nya text-till-bild-modell, DALL-E 3, kan översätta nyanserade förfrågningar till extremt detaljerade och exakta bilder.
Kommer snart till ChatGPT Plus & Enterprise, som kan hjälpa dig att skapa fantastiska uppmaningar för att få dina idéer till liv:https://t.co/jDXHGNmarT pic.twitter.com/aRWH5giBPL
- OpenAI (@OpenAI) 20 september 2023
Bilden är enkel, men att AI:n kan infoga texten på ett korrekt sätt är en stor skillnad.
Säkerheten först
När DALL-E först släpptes kritiserades den för att vara partisk och för att tillåta användare att skapa fotorealistiska bilder med explicit innehåll. Det fanns också etiska och juridiska frågor som rörde imitation av konstnärer eller skapande av bilder av populära figurer.
Med DALL-E 3 har OpenAI satt upp ett antal skyddsräcken för att hålla verktyget på rätt sida av dessa frågor.
OpenAI säger att de har "vidtagit åtgärder för att begränsa DALL-E 3:s förmåga att generera våldsamt, vuxet eller hatiskt innehåll". Om du använder en offentlig persons namn i din fråga kommer verktyget att avvisa din begäran om att generera bilden.
OpenAI anlitade red teamers för att stresstesta DALL-E 3 för att kontrollera effektiviteten i dess ansträngningar för att minska fördomar, propaganda och felaktig information.
Upphovsrätt och skydd av immateriella rättigheter är ständigt aktuella frågor och många konstnärer beklagar sig över AI-genererade derivat av deras verk. DALL-E 3 har utformats för att avvisa förfrågningar om att generera bilder i samma stil som en levande konstnär.
Konstnärer kan också skicka in ett formulär för att be OpenAI att ta bort deras bilder från träningsdatasetet för DALL-E 3.
I takt med att AI-genererade bilder blir bättre blir det allt svårare att avgöra om en bild är skapad med hjälp av AI eller inte. OpenAI säger att de testar ett verktyg som ska hjälpa till att identifiera bilder som skapats med hjälp av DALL-E 3, men gav inga fler detaljer.
Om du är en ChatGPT Plus-användare kommer du att få leka med DALL-E 3 några veckor från och med nu, men det finns inget ord om när en gratisversion förväntas.