A OpenAI deu-nos uma espreitadela no DALL-E 3 há algumas semanas, mas agora qualquer pessoa pode utilizar o gerador de imagens de IA gratuitamente no Bing da Microsoft.
No comunicado de imprensa inicial, A OpenAI afirmou que DALL-E 3 seria integrado na versão paga do ChatGPT. O vídeo de demonstração que mostrava como funcionaria era impressionante, mas os utilizadores do ChatGPT ainda estão à espera da sua vez.
A Microsoft parece ter saltado a fila com o impressionante gerador de imagens agora disponível gratuitamente para os utilizadores de Bing Chat ou o seu Criador de imagens plataformas.
A Microsoft também está a lançar a sua ferramenta Paint Cocreator com DALLE-3, que é um assistente criativo na sua aplicação Paint.
Assim que o anúncio foi feito, os servidores da Microsoft ficaram rapidamente sobrecarregados com a quantidade de utilizadores que queriam experimentar a nova versão do DALL-E. Mikhail Parakhin, Diretor-Geral de Publicidade e Serviços Web da Microsoft, escreveu no Twitter: "Esperávamos um grande interesse, mas não esperávamos TANTO".
Pessoal, sabemos que a geração do DALL-E 3.0 está a demorar mais do que o normal. Esperávamos um grande interesse, mas não esperávamos TANTO, especialmente por ser um fim de semana. Com a chegada de mais GPUs, a situação vai melhorar em breve.
- Mikhail Parakhin (@MParakhin) 1 de outubro de 2023
Os servidores adicionais prometidos devem ter funcionado, porque quando experimentei as imagens foram geradas muito rapidamente.
A Microsoft reiterou as afirmações da OpenAI de que o DALL-E 3 foi um avanço na geração de texto para imagem. A ferramenta actualizada promete um seguimento mais preciso das instruções, mais coerência e um melhor fotorrealismo e estética.
A OpenAI já tinha dado a entender que estava a ser preparada uma marca de água digital e a publicação no blogue da Microsoft confirmou que esta adiciona uma marca de água digital invisível que cumpre a especificação C2PA. Será interessante ver se esta a marca de água pode ser quebrada como todas as outras.
O DALL-E 3 tem uma forte moderação de conteúdos, pelo que não será possível gerar quaisquer imagens NSFW.
As imagens que consegui gerar eram bastante boas, embora não correspondessem às minhas expectativas de fotorrealismo.
Sugestão: um rapaz e uma rapariga a salpicar poças de água depois da chuva, fotorrealista
Uma das características realmente impressionantes do DALLE-3 é a sua capacidade de gerar texto, o que constitui um desafio comum para os geradores de imagens de IA.
Sugestão: fotografia por cima do ombro de um idoso a ler um exemplar de Tom Sawyer
As imagens são geradas com uma resolução de 1024×1024, o que é ótimo para utilização na Web. Esperemos que seja adicionada a opção de alterar o rácio de aspeto, uma vez que, por enquanto, estamos limitados a 1:1. Uma opção de outpaint e upscaling também seria óptima.
Para já, este parece ser um dos melhores geradores de imagens de IA e, o melhor de tudo, é totalmente gratuito.