A OpenAI está a desenvolver o DALL-E 3, uma versão melhorada do seu gerador de texto para imagem.
De acordo com o YouTuber MattVidPro AI, cerca de 400 pessoas têm atualmente acesso a um servidor de testes privado para DALL-E 3, tendo havido várias fugas de informação sobre o seu trabalho.
Um vídeo partilhado por MattVidPro AI mostrou como as versões de teste de DALL-E evoluíram de maio para julho.
Esta versão evoluída do DALL-E parece ser capaz de gerar imagens foto-reais e utilizar técnicas específicas, como pinceladas ou desenhos a lápis.
A versão inédita de DALL-E também pode gerar imagens com sangue, sangue e conteúdo protegido por direitos de autor, de acordo com MattVidPro AI - ele forneceu alguns exemplos de fotos envolvendo uma barra de Snickers e Subway.
É também excelente na produção de tipografia, um calcanhar de Aquiles dos modelos de texto para imagem actuais e passados.
O YouTuber descreveu a ferramenta como "extremamente excitante. Isto é muito melhor do que qualquer coisa que tenhamos visto antes. É de loucos".
Afirmou ainda que "o Midjourney não pode competir a este nível. Acho que nem mesmo a versão 6 do Midjourney seria capaz de competir a este nível".
Os comentadores do vídeo sublinham a fraca capacidade de MidJourney para seguir as instruções, que DALL-E 3 supostamente resolve.
E continua: "Pode fazer cópias exactas de obras de arte e materiais protegidos por direitos de autor. Pode fazer personagens protegidas por direitos de autor na perfeição, logótipos na perfeição, representações completamente exactas de celebridades e representações completas de violência extrema" e continua dizendo que o modelo por vezes produz imagens inapropriadas sem estar explicitamente programado para o fazer.
"É evidente que têm de fazer alguns ajustes e algum trabalho de segurança", diz Matt.
Comparações com outras IAs de texto para imagem
As comparações entre o novo DALL-E e o último modelo da Midjourney mostraram que o conteúdo da OpenAI é superior, com melhor aderência às instruções dadas e melhor qualidade de imagem.
No entanto, a atualização do DALL-E 3 ainda está em desenvolvimento e a sua data de lançamento oficial permanece incerta. É claro que este vídeo do YouTube foi concebido para promover o DALL-E 3, e a versão pública será provavelmente muito diferente das versões de teste "secretas".
Uma vez lançado, DALL-E 3 terá provavelmente várias restrições, tais como a neutralização de imagens que envolvam sangue, sangue, conteúdo protegido por direitos de autor e reproduções de obras de arte.
DALL-E 3 colocará a OpenAI de novo no topo do mercado da IA de geração de imagens?