Berichten zufolge entwickelt OpenAI derzeit DALL-E 3, eine verbesserte Version seines Text-Bild-Generators.
Nach Angaben des YouTubers MattVidPro AI haben derzeit rund 400 Personen Zugang zu einem privaten Testserver für DALL-E 3, und es sind bereits mehrere Bilder von dessen Arbeit durchgesickert.
Ein von MattVidPro AI geteiltes Video zeigt, wie sich die Testversionen von DALL-E von Mai bis Juli entwickelt haben.
Diese weiterentwickelte Version von DALL-E scheint in der Lage zu sein, fotorealistische Bilder zu erzeugen und spezielle Techniken wie Pinselstriche oder Bleistiftzeichnungen zu verwenden.
Die unveröffentlichte Version von DALL-E kann laut MattVidPro AI auch Bilder erzeugen, auf denen Blut und urheberrechtlich geschützte Inhalte zu sehen sind - er lieferte einige Beispiele für Fotos mit einem Snickers-Riegel und Subway.
Es eignet sich auch hervorragend für die Erstellung von Typografie, eine Achillesferse früherer und heutiger Text-zu-Bild-Modelle.
Der YouTuber beschrieb das Tool als "extrem spannend. Das stellt alles in den Schatten, was wir bisher gesehen haben. Es ist Wahnsinn."
Er sagte auch, dass "Midjourney auf diesem Niveau nicht mithalten kann. Ich glaube nicht einmal, dass Midjourney Version sechs in der Lage wäre, auf diesem Niveau zu konkurrieren".
In den Kommentaren zu dem Video wird hervorgehoben, dass MidJourney nicht in der Lage ist, sich an Aufforderungen zu halten, was DALL-E 3 angeblich beheben soll.
Er fährt fort: "Sie können exakte Kopien von urheberrechtlich geschützten Kunstwerken und Materialien erstellen. Es kann urheberrechtlich geschützte Charaktere perfekt darstellen, Logos perfekt abbilden, Berühmtheiten absolut akkurat abbilden und extreme Gewalt darstellen" und fährt fort, dass das Modell manchmal unangemessene Bilder produziert, ohne explizit darauf programmiert zu sein.
"Sie müssen eindeutig noch etwas an der Feinabstimmung und an der Sicherheit arbeiten", sagt Matt.
Vergleiche mit anderen Text-zu-Bild-KIs
Vergleiche zwischen dem neuen DALL-E und dem neuesten Modell von Midjourney ergaben, dass der Inhalt von OpenAI besser ist, die vorgegebenen Anweisungen besser befolgt werden und die Bildqualität besser ist.
Das DALL-E 3-Upgrade befindet sich jedoch noch in der Entwicklung, und das offizielle Veröffentlichungsdatum ist noch ungewiss. Natürlich soll dieses YouTube-Video DALL-E 3 anpreisen, und die öffentliche Version wird sich wahrscheinlich stark von den "geheimen" Testversionen unterscheiden.
Nach der Freigabe wird DALL-E 3 wahrscheinlich einige Einschränkungen aufweisen, wie z. B. die Kastration von Bildern mit Blut, blutigen Stellen, urheberrechtlich geschützten Inhalten und Reproduktionen von Kunstwerken.
Wird DALL-E 3 OpenAI wieder an die Spitze des Marktes für KI zur Bilderzeugung bringen?