Midjourney har sluppet V6 av sin allerede imponerende AI-bildegenereringsmodell som en Alpha-utgivelse på sin Discord-server.
V6 kommer med en rekke viktige forbedringer, men den største oppgraderingen er at Midjourney nå kan legge til tekst i bildene dine. Det har vært en utfordring for alle AI-bildegeneratorer å legge til tekst i bilder med korrekt stavemåte. DALL-E la til funksjonen i sin siste versjon, og Midjourney-brukernes ventetid på lignende funksjonalitet er endelig over.
Tekstplassering, rettskriving og overholdelse av stilanvisninger er ikke 100%, men det er likevel ganske bra.
Midjourney V6 .... Vi har TEKST!
Det kan være en hit eller miss, men jeg lærer fortsatt hvordan det fungerer.
Disse fire var alle fra samme generasjon.
Kanskje hadde vi flaks 🤷♂️
Spør i bilde 1 ALT#midjourneyV6 #MJV6 #AIart #aiartfellesskapet #digitalkunst #midjouney #MidjourneyAI #AIArtwork pic.twitter.com/BIJwr49489- Orcton (@OrctonAI) 21. desember 2023
Detaljnivået og realismen i de genererte bildene har også fått en stor oppgradering. I sin kunngjøring av lanseringen av V6 sa Midjourney-grunnlegger David Holz: "Denne modellen kan generere mye mer realistiske bilder enn noe annet vi har lansert tidligere."
Noen av bildene som deles av Midjourney-brukere, ser fantastiske ut.
Midjourney V6 ser veldig smakfull ut!
Enorm økning i detaljrikdom med samme oppløsning.
Dette er IKKE endelige modellbilder og er ikke oppskalert.#midjouney #AIArtCommuity pic.twitter.com/SJYK6v7LyC- GifCo (@giffboake) 20. desember 2023
Som med alle andre bildegeneratorer er kvaliteten på resultatet i stor grad avhengig av kreativiteten til brukeren. Fordi V6 er mye flinkere til å følge nyansene i instruksjonene, blir de endelige bildene bedre tilpasset ideen som skaperen hadde i tankene.
Chris Perna, som var art director hos Epic Games i 22 år, satte Midjourney V6 på prøve og kom opp med noen virkelig gode bilder.
Se dette innlegget på Instagram
Nye prompting-metoder
Å skrive en ledetekst for å få tidligere versjoner av Midjourney til å levere det bildet du ønsket, innebar mye triksing. Brukerne inkluderte kameramodeller, objektivtyper, bildeoppløsning og en rekke andre fraser for å få det riktige utseendet.
Med V6 har dette endret seg mye. "Prompting med V6 er vesentlig annerledes enn med V5. Du må lære deg hvordan du skal spørre på nytt. V6 er mye mer følsom for ledeteksten din. Unngå "søppel" som "prisvinnende, fotorealistisk, 4k, 8k"", forklarer Holz.
Holz sier at brukerne må være mer eksplisitte i sine instruksjoner, og at V6 nå åpner for lengre og mer detaljerte instruksjoner slik at bildene i større grad samsvarer med brukerens syn.
Remiksing av bilder samt oppskalering av bilder er også forbedret i V6. Siden dette er en Alpha-versjon, er det noen få funksjoner som ikke støttes ennå. Panorering, zoom og varier region er tilgjengelig i V5.2, men vi må vente en stund på at disse funksjonene blir lagt til i V6.
Det er utrolig å se hvordan AI-bildegeneratorer har utviklet seg. Det er lett å glemme hvor begeistret vi var da de først kom på banen, selv om de genererte ganske dårlige bilder. Dette innlegget fra Marco Nedermeijer er et godt eksempel på hvordan Midjourney har forbedret seg siden juli 2022.
Midtveisreise v1 til v6, samme melding"
hvit bakgrunn, nærbilde portrett av en veldig gammel, slem mann, 92 år gammel, rynker, realistisk hud, studiobelysning,, canon f/4#midjourneyV6 #midjouney #aiartfellesskapet pic.twitter.com/g8wAALAbH3
- Marco Nedermeijer (@MNedermeijer) 21. desember 2023
Det blir stadig vanskeligere å velge mellom de ulike AI-bildegeneratorene, ettersom mulighetene deres nærmer seg hverandre. Midjourney-brukere er stort sett henvist til Discord-grensesnittet, selv om brukere som har generert mer enn 10 000 bilder, blir tilbudt tilgang til en nettplattform.
Den store fordelen Midjourney har i forhold til andre alternativer som DALL-E, er at det lar deg generere bilder av ekte mennesker. Dette gjør det sannsynligvis til det beste verktøyet for folk som prøver å lage parodisk innhold eller desinformasjon.
Hva blir det neste for Midjourney? Det har kommet flere gode bildeanimatorer eller tekst-til-videoverktøy på nettet i det siste. Kanskje Midjourney vil la oss legge til bevegelse i bildene våre i neste versjon.