OpenAI nous a donné un aperçu de DALL-E 3 il y a quelques semaines, mais tout le monde peut désormais utiliser gratuitement le générateur d'images d'IA sur le site Bing de Microsoft.
Dans le communiqué de presse initial, OpenAI a déclaré que DALL-E 3 serait intégré à la version payante de ChatGPT. La vidéo de démonstration montrant le fonctionnement était impressionnante, mais les utilisateurs de ChatGPT attendent toujours leur tour.
Microsoft a apparemment pris les devants en mettant l'impressionnant générateur d'images à la disposition des utilisateurs de Bing Chat ou son Créateur d'images plates-formes.
Microsoft déploie également son outil Paint Cocreator, alimenté par DALLE-3, qui est un assistant créatif dans son application Paint.
Une fois l'annonce faite, les serveurs de Microsoft ont été rapidement submergés par le nombre d'utilisateurs souhaitant essayer la nouvelle version de DALL-E. Mikhail Parakhin, directeur général de la publicité et des services web chez Microsoft, a tweeté : "Nous nous attendions à un fort intérêt, mais nous ne nous attendions pas à un tel engouement".
Nous savons que la génération de DALL-E 3.0 prend plus de temps que d'habitude. Nous nous attendions à ce que l'intérêt soit fort, mais nous ne nous attendions pas à ce qu'il le soit autant, d'autant plus que c'est un week-end. Le fait d'apporter plus de GPU va nous permettre d'améliorer la situation rapidement.
- Mikhail Parakhin (@MParakhin) 1er octobre 2023
Les serveurs supplémentaires promis ont dû faire l'affaire, car lorsque je l'ai essayé, les images ont été générées assez rapidement.
Microsoft a réitéré les affirmations de l'OpenAI selon lesquelles DALL-E 3 constituait une percée dans la génération de texte à partir d'images. L'outil mis à jour promet un suivi plus précis des messages, une plus grande cohérence, ainsi qu'un photoréalisme et une esthétique améliorés.
OpenAI a précédemment laissé entendre qu'un filigrane numérique était en préparation et le billet de blog de Microsoft a confirmé qu'il ajoute un filigrane numérique invisible qui adhère à la spécification C2PA. Il sera intéressant de voir si cette Le filigrane peut être cassé comme tous les autres l'ont été.
DALL-E 3 est doté d'un système de modération du contenu très performant, de sorte que vous ne pourrez pas générer d'images inappropriées.
Les images que j'ai réussi à générer étaient assez bonnes, même si elles ne correspondaient pas tout à fait à mes attentes en matière de photoréalisme.
Prompt : un garçon et une fille s'éclaboussant dans des flaques d'eau après la pluie, photoréaliste
L'une des caractéristiques vraiment impressionnantes de DALLE-3 est sa capacité à générer du texte, ce qui est un défi courant pour les générateurs d'images d'IA.
Prompt : prise de vue au-dessus de l'épaule d'un vieil homme lisant un exemplaire de Tom Sawyer
Les images sont générées à une résolution de 1024×1024, ce qui est idéal pour une utilisation sur le web. Espérons qu'ils ajouteront l'option de changer le ratio d'aspect car vous êtes bloqué à 1:1 pour l'instant. Une option d'outpaint et d'upscaling serait également appréciable.
Pour l'instant, il s'agit de l'un des meilleurs générateurs d'images d'IA et, surtout, il est entièrement gratuit.