OpenAI hat uns vor ein paar Wochen einen kleinen Vorgeschmack auf DALL-E 3 gegeben, aber jetzt kann jeder den KI-Bildgenerator kostenlos auf Microsofts Bing nutzen.
In der ursprünglichen Pressemitteilung, OpenAI sagte, dass DALL-E 3 in die kostenpflichtige Version von ChatGPT integriert werden würde. Das Demo-Video, das zeigte, wie es funktionieren würde, war beeindruckend, aber ChatGPT-Benutzer warten immer noch auf ihren Zug.
Microsoft hat anscheinend die Warteschlange übersprungen, denn der beeindruckende Bildgenerator ist jetzt für Benutzer von Bing-Schwätzer oder seine Bildschöpfer Plattformen.
Microsoft führt außerdem das DALLE-3-gestützte Tool Paint Cocreator ein, einen kreativen Assistenten in der Paint-App.
Nach der Ankündigung waren die Server von Microsoft schnell von der Menge an Nutzern überwältigt, die die neue Version von DALL-E ausprobieren wollten. Mikhail Parakhin, CEO von Advertising and Web Services bei Microsoft, twitterte: "Wir haben ein starkes Interesse erwartet, aber nicht so viel".
Leute, wir wissen, dass die Generierung von DALL-E 3.0 im Moment länger dauert als normal. Wir haben mit einem starken Interesse gerechnet, aber nicht mit so viel, vor allem, weil es ein Wochenende ist. Wenn wir mehr GPUs reinbringen, wird es bald besser sein.
- Mikhail Parakhin (@MParakhin) 1. Oktober 2023
Die versprochenen zusätzlichen Server müssen ihren Zweck erfüllt haben, denn als ich es ausprobierte, wurden die Bilder ziemlich schnell erzeugt.
Microsoft wiederholte die Behauptungen von OpenAI, dass DALL-E 3 ein Durchbruch bei der Text-Bild-Erzeugung sei. Das aktualisierte Tool verspricht eine präzisere Eingabeaufforderung, mehr Kohärenz sowie verbesserten Fotorealismus und Ästhetik.
OpenAI hat bereits angedeutet, dass ein digitales Wasserzeichen in Arbeit ist, und Microsofts Blogbeitrag bestätigt, dass es ein unsichtbares digitales Wasserzeichen hinzufügt, das der C2PA-Spezifikation entspricht. Es wird interessant sein zu sehen, ob dies Wasserzeichen kann wie alle anderen gebrochen werden.
DALL-E 3 hat eine strenge Inhaltsmoderation eingebaut, so dass Sie keine NSFW-Bilder erstellen können.
Die Bilder, die ich erzeugen konnte, sahen ziemlich gut aus, auch wenn sie nicht ganz meinen Erwartungen an den Fotorealismus entsprachen.
Aufforderung: ein Junge und ein Mädchen, die nach dem Regen durch Pfützen planschen, fotorealistisch
Eine der wirklich beeindruckenden Eigenschaften von DALLE-3 ist seine Fähigkeit, Text zu generieren, was eine häufige Herausforderung für KI-Bildgeneratoren darstellt.
Aufforderung: Blick über die Schulter auf einen alten Mann, der eine Ausgabe von Tom Sawyer liest
Die Bilder werden mit einer Auflösung von 1024×1024 generiert, was für die Verwendung im Web ideal ist. Hoffentlich werden sie die Option hinzufügen, um das Seitenverhältnis zu ändern, weil Sie mit 1:1 für jetzt fest sind. Eine Outpaint- und Upscaling-Option wäre auch toll.
Im Moment scheint dies einer der besten AI-Bildgeneratoren zu sein, und das Beste ist, dass er völlig kostenlos ist.