Midjourney a publié la V6 de son déjà impressionnant modèle de génération d'images par l'IA en version Alpha sur son serveur Discord.
La V6 apporte un certain nombre d'améliorations significatives, mais la plus importante est que Midjourney peut désormais ajouter du texte à vos images. L'ajout de texte aux images avec une orthographe correcte a été un défi pour tous les générateurs d'images AI. DALL-E a ajouté cette fonctionnalité dans sa dernière version et l'attente des utilisateurs de Midjourney pour une fonctionnalité similaire est enfin terminée.
Le placement du texte, l'orthographe et la conformité aux instructions de style ne sont pas 100%, mais ils sont tout de même assez bons.
Midjourney V6 .... Nous avons le TEXTE !
Il peut y avoir des hauts et des bas, mais je suis encore en train d'apprendre comment cela fonctionne.
Ces quatre personnes étaient toutes issues d'une même génération.
Il a peut-être eu de la chance 🤷♂️
Invite dans l'image 1 ALT#midjourneyV6 #MJV6 #AIart #aiartcommunity #digitalart #midjouney #MidjourneyAI #AIArtwork pic.twitter.com/BIJwr49489- Orcton (@OrctonAI) 21 décembre 2023
Le niveau de détail et le réalisme des images générées ont également été améliorés. Lors de l'annonce de la sortie de la V6, le fondateur de Midjourney, David Holz, a déclaré : "Ce modèle peut générer des images beaucoup plus réalistes que tout ce que nous avons publié auparavant".
Certaines des images partagées par la communauté des utilisateurs de Midjourney sont étonnantes.
Le Midjourney V6 a l'air très appétissant !
Augmentation considérable du niveau de détail à résolution égale.
Il ne s'agit PAS d'images de modèles finaux et elles ne sont pas agrandies.#midjouney #AIArtCommuity pic.twitter.com/SJYK6v7LyC- GifCo (@giffboake) 20 décembre 2023
Comme pour tout générateur d'images, la qualité du résultat dépend fortement de la créativité de l'utilisateur. Comme V6 est beaucoup plus apte à suivre les nuances des invites, les images finales correspondent mieux à l'idée que le créateur avait en tête.
Chris Perna, qui a été directeur artistique chez Epic Games pendant 22 ans, a mis Midjourney V6 à l'épreuve et en a tiré de très bonnes images.
Voir ce message sur Instagram
Nouvelles méthodes d'incitation
L'écriture d'une invite permettant aux versions précédentes de Midjourney de fournir l'image souhaitée impliquait de nombreux artifices. Les utilisateurs incluaient des modèles d'appareils photo, des types d'objectifs, la résolution de l'image et de nombreuses autres phrases pour obtenir le bon résultat.
Avec la V6, les choses ont beaucoup changé. "Les messages-guides de la V6 sont très différents de ceux de la V5. Vous devrez "réapprendre" à lancer des messages. La V6 est beaucoup plus sensible à votre message. Évitez les "trucs" comme "primé, photoréaliste, 4k, 8k"", explique M. Holz.
Selon M. Holz, les utilisateurs devront être plus explicites dans leurs messages et V6 permet désormais des messages plus longs et plus détaillés, de sorte que les images correspondent mieux à la vision de l'utilisateur.
Le remixage d'images ainsi que les upscalers d'images ont également été améliorés dans la V6. Comme il s'agit d'une version Alpha, certaines fonctionnalités ne sont pas encore prises en charge. Les fonctions de panoramique, de zoom et de variation de région sont disponibles dans la version 5.2, mais il faudra attendre un peu pour qu'elles soient ajoutées à la version 6.
Il est étonnant de voir à quel point les générateurs d'images d'IA ont progressé. Il est facile d'oublier à quel point nous étions enthousiastes lorsqu'ils sont apparus pour la première fois, même s'ils généraient des images assez mauvaises. Ce billet de Marco Nedermeijer est un excellent exemple de la façon dont Midjourney s'est amélioré depuis juillet 2022.
De la v1 à la v6, le même message d'accueil".
fond blanc, portrait en gros plan d'un très vieil homme méchant, 92 ans, rides, peau réaliste, éclairage studio, canon f/4#midjourneyV6 #midjouney #aiartcommunity pic.twitter.com/g8wAALAbH3
- Marco Nedermeijer (@MNedermeijer) 21 décembre 2023
Le choix entre les différents générateurs d'images d'IA devient de plus en plus difficile à mesure que leurs capacités convergent. Les utilisateurs de Midjourney sont pour la plupart bloqués sur l'interface Discord, mais les utilisateurs qui ont généré plus de 10 000 images se voient offrir l'accès à une plateforme web.
Le grand avantage de Midjourney par rapport à d'autres options comme DALL-E est qu'il vous permet de générer des images de personnes réelles. Cela en fait probablement l'outil de prédilection des personnes qui essaient de créer des contenus parodiques ou des images de personnes réelles. désinformation.
Quelle est la prochaine étape pour Midjourney ? Il y a plusieurs bons animateurs d'images ou outils de conversion de texte en vidéo qui ont été mis en ligne récemment. Peut-être que Midjourney nous permettra d'ajouter du mouvement à nos images dans leur prochaine version.