Midjourney har släppt V6 av sin redan imponerande AI-bildgenereringsmodell som en Alpha-version på sin Discord-server.
V6 kommer med ett antal betydande förbättringar men den största uppgraderingen är att Midjourney nu kan lägga till text i dina bilder. Att lägga till text till bilder med korrekt stavning har varit en utmaning för alla AI-bildgeneratorer. DALL-E lade till funktionen i sin senaste version och Midjourney-användarnas väntan på liknande funktionalitet är äntligen över.
Textens placering, stavning och överensstämmelse med stiluppmaningar är inte 100% men det är fortfarande ganska bra.
Midjourney V6 .... Vi har TEXT!
Det kan vara hit eller missa men lär mig fortfarande hur det fungerar.
Dessa 4 var alla från samma generation.
Kanske hade du tur 🤷♂️
Prompt i bild 1 ALT#midjourneyV6 #MJV6 #AIart #aiartgemenskapen #digitalkonst #midjouney #MidjourneyAI #AIAArbete pic.twitter.com/BIJwr49489- Orcton (@OrctonAI) 21 december 2023
Detaljnivån och realismen i de genererade bilderna har också fått en rejäl uppgradering. I sitt tillkännagivande av lanseringen av V6 sa Midjourneys grundare David Holz: "Den här modellen kan generera mycket mer realistiska bilder än något vi har släppt tidigare."
Några av de bilder som delas av Midjourneys användare ser fantastiska ut.
Midjourney V6 ser väldigt smaklig ut!
Enorm ökning av detaljrikedomen vid samma upplösning.
Detta är INTE bilder av den slutliga modellen och de är inte uppskalade.#midjouney #AIArtCommuity pic.twitter.com/SJYK6v7LyC- GifCo (@giffboake) 20 december 2023
Som med alla bildgeneratorer är kvaliteten på resultatet starkt beroende av användarens kreativitet. Eftersom V6 är mycket bättre på att följa nyanserna i uppmaningar, är de slutliga bilderna bättre anpassade till den idé som skaparen hade i åtanke.
Chris Perna, som var art director på Epic Games i 22 år, satte Midjourney V6 på prov och fick fram några riktigt bra bilder.
Visa detta inlägg på Instagram
Nya promptmetoder
Att skriva en prompt för att få tidigare versioner av Midjourney att leverera den bild du ville ha innebar en hel del trixande med prompten. Användarna skulle inkludera kameramodeller, objektivtyper, bildupplösning och en massa andra fraser för att få rätt utseende.
Med V6 har det förändrats en hel del. "Prompting med V6 är väsentligt annorlunda än med V5. Du kommer att behöva 'lära dig' hur du ska fråga. V6 är mycket mer känslig för din prompt. Undvik 'skräp' som 'prisbelönt, fotorealistiskt, 4k, 8k'", förklarar Holz.
Holz säger att användarna måste vara tydligare i sina uppmaningar och att V6 nu tillåter längre och mer detaljerade uppmaningar så att bilderna bättre matchar användarens vision.
Remixning av bilder samt uppskalning av bilder har också förbättrats i V6. Eftersom det här är en Alphaversion finns det några funktioner som inte stöds ännu. Panorera, zooma och variera region finns i V5.2 men vi får vänta ett tag innan dessa läggs till i V6.
Det är fantastiskt att se hur AI-bildgeneratorer har utvecklats. Det är lätt att glömma hur glada vi var när de först dök upp på scenen trots att de genererade ganska dåliga bilder. Det här inlägget från Marco Nedermeijer är ett bra exempel på hur Midjourney har förbättrats sedan juli 2022.
Mitt i resan v1 till v6, samma prompt"
vit bakgrund, närbildsporträtt av en mycket gammal elak man, 92 år gammal, rynkor, realistisk hud, studioljus,, canon f/4#midjourneyV6 #midjouney #aiartgemenskapen pic.twitter.com/g8wAALAbH3
- Marco Nedermeijer (@MNedermeijer) 21 december 2023
Att välja mellan de olika AI-bildgeneratorerna blir allt svårare i takt med att deras funktioner närmar sig varandra. Midjourney-användare är oftast fast med Discord-gränssnittet, även om användare som har genererat mer än 10 000 bilder erbjuds tillgång till en webbplattform.
Den stora fördelen som Midjourney har jämfört med andra alternativ som DALL-E är att det låter dig generera bilder av riktiga människor. Detta gör det förmodligen till go-to-verktyget för människor som försöker skapa parodiskt innehåll eller desinformation.
Vad händer härnäst för Midjourney? Det finns flera bra bildanimatorer eller text-till-videoverktyg som kommer online på senare tid. Kanske kommer Midjourney att låta oss lägga till rörelse i våra bilder i sin nästa version.