A Midjourney lançou o V6 do seu já impressionante modelo de geração de imagens de IA como uma versão Alpha no seu servidor Discord.
O V6 vem com uma série de melhorias significativas, mas a maior atualização é que o Midjourney pode agora adicionar texto às suas imagens. Adicionar texto a imagens com a ortografia correcta tem sido um desafio para todos os geradores de imagens de IA. DALL-E adicionou a funcionalidade na sua última versão e a espera dos utilizadores do Midjourney por uma funcionalidade semelhante chegou finalmente ao fim.
A colocação do texto, a ortografia e a conformidade com as instruções de estilo não é 100%, mas é bastante boa.
Midjourney V6 .... Temos TEXTO!
Pode ser um sucesso ou um fracasso, mas ainda estou a aprender como funciona.
Estes 4 eram todos da mesma geração.
Talvez tenha tido sorte 🤷♂️
Prompt na imagem 1 ALT#midjourneyV6 #MJV6 #AIart #aiartcomunidade #digitalart #midjouney #MidjourneyAI #AIArtwork pic.twitter.com/BIJwr49489- Orcton (@OrctonAI) 21 de dezembro de 2023
O nível de detalhe e realismo das imagens geradas também sofreu uma grande atualização. No seu anúncio do lançamento do V6, o fundador da Midjourney, David Holz, afirmou: "Este modelo consegue gerar imagens muito mais realistas do que qualquer outro que tenhamos lançado anteriormente."
Algumas das imagens partilhadas pela comunidade de utilizadores do Midjourney são fantásticas.
O Midjourney V6 está a ficar muito saboroso!
Enorme aumento de pormenor com a mesma resolução.
Estas imagens NÃO são imagens do modelo final e não são melhoradas.#midjouney #AIArtCommuity pic.twitter.com/SJYK6v7LyC- GifCo (@giffboake) 20 de dezembro de 2023
Tal como acontece com qualquer gerador de imagens, a qualidade do resultado depende muito da criatividade do utilizador. Como o V6 é muito melhor a seguir as nuances dos prompts, as imagens finais estão mais bem alinhadas com a ideia que o criador tinha em mente.
Chris Perna, que foi diretor artístico da Epic Games durante 22 anos, pôs o Midjourney V6 à prova e conseguiu algumas imagens muito boas.
Ver esta publicação no Instagram
Novos métodos de solicitação
Escrever um prompt para que as versões anteriores do Midjourney fornecessem a imagem desejada envolvia muitos truques de prompt. Os utilizadores incluíam modelos de câmaras, tipos de lentes, resolução de imagem e muitas outras frases para obter o aspeto certo.
Com a V6, isso mudou muito. "O envio de mensagens com a V6 é significativamente diferente da V5. Terá de "reaprender" a dar instruções. A V6 é muito mais sensível às suas instruções. Evite 'lixo' como 'premiado, fotorrealista, 4k, 8k'", explicou Holz.
Holz afirma que os utilizadores terão de ser mais explícitos nas suas indicações e que o V6 permite agora indicações mais longas e detalhadas para que as imagens correspondam melhor à visão do utilizador.
A remistura de imagens, bem como os upscalers de imagens, também foram melhorados na V6. Uma vez que esta é uma versão Alfa, existem algumas funcionalidades que ainda não são suportadas. A panorâmica, o zoom e a variação de região estão disponíveis na versão 5.2, mas teremos de esperar algum tempo até que sejam adicionados à versão 6.
É espantoso ver como os geradores de imagens de IA avançaram. É fácil esquecer como ficámos entusiasmados quando eles apareceram pela primeira vez, apesar de gerarem imagens bastante más. Esta publicação de Marco Nedermeijer é um ótimo exemplo de como o Midjourney melhorou desde julho de 2022.
Da viagem v1 até à v6, a mesma mensagem"
fundo branco, retrato em grande plano de um homem muito velho, 92 anos, rugas, pele realista, iluminação de estúdio, canon f/4#midjourneyV6 #midjouney #aiartcomunidade pic.twitter.com/g8wAALAbH3
- Marco Nedermeijer (@MNedermeijer) 21 de dezembro de 2023
A escolha entre os diferentes geradores de imagens de IA está a tornar-se mais difícil à medida que as suas capacidades convergem. Os utilizadores do Midjourney estão, na sua maioria, presos à interface Discord, embora aos utilizadores que geraram mais de 10 000 imagens esteja a ser oferecido acesso a uma plataforma Web.
A grande vantagem do Midjourney em relação a outras opções como o DALL-E é o facto de permitir gerar imagens de pessoas reais. Isto torna-o provavelmente a ferramenta ideal para quem está a tentar criar conteúdo de paródia ou desinformação.
O que é que se segue para a Midjourney? Há vários bons animadores de imagens ou ferramentas de texto para vídeo que estão a aparecer online ultimamente. Talvez o Midjourney nos permita adicionar movimento às nossas imagens na sua próxima versão.