Midjourney ha rilasciato la versione V6 del suo già impressionante modello di generazione di immagini AI come versione Alpha sul suo server Discord.
La V6 presenta una serie di miglioramenti significativi, ma il più importante è che Midjourney può ora aggiungere testo alle immagini. L'aggiunta di testo alle immagini con un'ortografia corretta è stata una sfida per tutti i generatori di immagini AI. DALL-E ha aggiunto questa funzione nella sua ultima release e l'attesa degli utenti di Midjourney per una funzionalità simile è finalmente finita.
La collocazione del testo, l'ortografia e la conformità alle indicazioni di stile non sono da 100%, ma sono comunque abbastanza buone.
Midjourney V6 .... Abbiamo il TESTO!
Può essere un'esperienza di successo o meno, ma sto ancora imparando a capire come funziona.
Questi 4 erano tutti di una sola generazione.
Forse è stato fortunato 🤷♂️
Prompt nell'immagine 1 ALT#midjourneyV6 #MJV6 #AIart #aiartcomunità #digitalart #midjouney #MidjourneyAI #AIArtwork pic.twitter.com/BIJwr49489- Orcton (@OrctonAI) 21 dicembre 2023
Anche il livello di dettaglio e di realismo delle immagini generate è stato notevolmente migliorato. Nell'annunciare l'uscita del V6, il fondatore di Midjourney, David Holz, ha dichiarato: "Questo modello è in grado di generare immagini molto più realistiche di qualsiasi altra cosa che abbiamo rilasciato in precedenza".
Alcune delle immagini condivise dalla comunità di utenti di Midjourney sono straordinarie.
Il Midjourney V6 si preannuncia molto appetitoso!
Enorme aumento dei dettagli a parità di risoluzione.
Queste NON sono immagini del modello finale e non sono state scalate.#midjouney #AIArtCommuity pic.twitter.com/SJYK6v7LyC- GifCo (@giffboake) 20 dicembre 2023
Come per ogni generatore di immagini, la qualità del risultato dipende dalla creatività dell'utente. Poiché V6 è molto più bravo a seguire le sfumature dei suggerimenti, le immagini finali sono più in linea con l'idea che il creatore aveva in mente.
Chris Perna, che è stato direttore artistico di Epic Games per 22 anni, ha messo alla prova Midjourney V6 e ha realizzato delle immagini davvero belle.
Visualizza questo post su Instagram
Nuovi metodi di richiesta
Scrivere un prompt per far sì che le versioni precedenti di Midjourney fornissero l'immagine desiderata comportava molti trucchi. Gli utenti includevano modelli di fotocamere, tipi di obiettivi, risoluzione dell'immagine e molte altre frasi per ottenere l'aspetto giusto.
Con la V6 le cose sono cambiate molto. "Il prompt con la V6 è molto diverso da quello della V5. È necessario 'reimparare' il modo in cui si richiedono i messaggi. La V6 è molto più sensibile alle richieste. Evitate le 'porcherie' come 'premiato, fotorealistico, 4k, 8k'", ha spiegato Holz.
Holz afferma che gli utenti dovranno essere più espliciti nei loro suggerimenti e che V6 consente ora di fornire suggerimenti più lunghi e dettagliati, in modo che le immagini corrispondano maggiormente alla visione dell'utente.
Anche il remix delle immagini e l'upscaler delle immagini sono stati migliorati nella V6. Trattandosi di una release Alpha, alcune funzioni non sono ancora supportate. Pan, zoom e varia regione sono disponibili nella V5.2, ma dovremo aspettare un po' prima che vengano aggiunte alla V6.
È sorprendente vedere come i generatori di immagini AI siano progrediti. È facile dimenticare quanto eravamo entusiasti quando sono arrivati sulla scena, anche se generavano immagini piuttosto brutte. Questo post di Marco Nedermeijer è un ottimo esempio di come Midjourney sia migliorato dal luglio 2022.
Da v1 a v6, stesso prompt".
sfondo bianco, ritratto ravvicinato di un uomo molto anziano e meschino, 92 anni, rughe, pelle realistica, illuminazione in studio, canon f/4#midjourneyV6 #midjouney #aiartcomunità pic.twitter.com/g8wAALAbH3
- Marco Nedermeijer (@MNedermeijer) 21 dicembre 2023
La scelta tra i diversi generatori di immagini AI sta diventando sempre più difficile, dato che le loro capacità convergono. Gli utenti di Midjourney sono per lo più bloccati all'interfaccia di Discord, anche se agli utenti che hanno generato più di 10.000 immagini viene offerto l'accesso a una piattaforma web.
Il grande vantaggio di Midjourney rispetto ad altre opzioni come DALL-E è che consente di generare immagini di persone reali. Questo probabilmente lo rende lo strumento ideale per le persone che cercano di creare contenuti parodistici o di disinformazione.
Qual è il prossimo passo di Midjourney? Ultimamente si stanno diffondendo molti buoni animatori di immagini o strumenti di text-to-video. Forse Midjourney ci permetterà di aggiungere movimento alle nostre immagini nella prossima versione.