Meta sagt, sein KI-Bildgenerator sei auf dem neuesten Stand der Technik

Juli 18, 2023

Meta hat seinen KI-Bildgenerator namens CM3leon vorgestellt und behauptet, dass er modernste Leistung bietet.

CM3leon, ausgesprochen "Chamäleon", steht für einen Leistungssprung im Wettlauf der Text-zu-Bild-Generierung. Während Tools wie DALL-E und Stable Diffusion beeindruckende Bilder erzeugen, sind in seine Ankündigung Meta behauptet, dass CM3leon diesen Tools in einer Reihe von Bereichen überlegen ist.

Die meisten Modelle wie Stable Diffusion und DALL-E sind Diffusionsmodelle. Diese Modelle liefern großartige Ergebnisse, aber ihr schrittweiser Ansatz zur Bilderzeugung ist langsam und benötigt viel Rechenleistung. Das Modell von Meta ist ein Transformationsmodell, das nach eigenen Angaben Modelle wie Googles Parti übertrifft. 

Es ist auch ein sehr viel effizienteres Modell, das fünfmal weniger Computerverarbeitung für das Training benötigt und viel kleinere Trainingsdatensätze als andere Modelle.

CM3leon ist eines der ersten Modelle, das sowohl lange als auch kurze Bildunterschriften für Bilder erzeugen kann. Man kann ihm auch Fragen zu einem Bild stellen. Meta gab ein Beispiel dafür, wie CM3leon auf Aufforderungen zu einem Bild mit einem Hund, der einen Stock trägt, reagiert.

Bild von Hund und Stock generiert von CM3leon
Bild von Hund und Stock generiert von CM3leon. Quelle: Meta

Frage zur Aufforderung: Was trägt der Hund bei sich?

Modell Generation: Stick

Aufforderung: Beschreiben Sie das gegebene Bild sehr detailliert.

Modell Generation: Auf diesem Bild ist ein Hund zu sehen, der einen Stock im Maul hält. Auf der Oberfläche befindet sich Gras. Im Hintergrund des Bildes sind Bäume zu sehen.

CM3leon ist in der Lage, sehr gut auf spezifische Details oder Nuancen in Eingabeaufforderungen zu reagieren. Und die Beispielbilder, die Meta in ihrer Ankündigung verwendet hat, scheinen zu zeigen, dass es bei kniffligen Dingen wie menschlichen Händen und dem Hinzufügen von Text zu generierten Bildern besser abschneidet als andere Modelle.

Von Metas CM3leon erzeugte Bilder
Mit CM3leon von Meta erzeugte Bilder. Quelle: Meta

Die entsprechenden Aufforderungen für diese Bilder waren:

(1) Ein kleiner Kaktus mit Strohhut und Neon-Sonnenbrille in der Wüste Sahara. (2) Eine Nahaufnahme einer menschlichen Hand, Handmodell. Hohe Qualität. (3) Eine Waschbär-Hauptfigur in einem Anime, die sich auf einen epischen Kampf mit einem Samurai-Schwert vorbereitet. Kampfhaltung. Fantasy, Illustration. (4) Ein Stoppschild im Fantasy-Stil mit der Aufschrift "1991".

Weitere interessante Funktionen, die Meta hervorgehoben hat, sind die textbasierte und strukturgeleitete Bildbearbeitung. So können Sie mit Hilfe von Text Bearbeitungen wie "Ändere den Himmel auf blau" anfordern oder ein Element an einer bestimmten x-y-Koordinate im Bild platzieren.

CM3leon wurde anhand von Millionen lizenzierter Bilder von Shutterstock trainiert, anstatt wie andere Modelle auf breiter Front zuzuschlagen und zu greifen. kritisiert für. Wie bei anderen Modellen wird auch CM3leon laut Meta die Verzerrungen in den Trainingsdaten widerspiegeln. Wenn man es also bittet, ein Bild eines Bauarbeiters zu erzeugen, wird es wahrscheinlich ein Bild eines Mannes erzeugen.  

Aber Meta geht zumindest offen damit um und kommentiert das Problem der Voreingenommenheit mit den Worten: "Während die Branche noch in den Anfängen steckt, diese Herausforderungen zu verstehen und zu bewältigen, glauben wir, dass Transparenz der Schlüssel zur Beschleunigung des Fortschritts sein wird."

Aus den Beispielen in ihrer Veröffentlichung und den Leistungsangaben geht hervor, dass CM3leon effizienter ist und ein viel besseres räumliches und kontextuelles Verständnis von Texteingaben hat als andere KI-Bildgeneratoren. 

Meta hat noch nicht gesagt, wann es CM3leon veröffentlichen wird, also müssen wir uns vorerst auf ihr Wort verlassen, wie gut diese Funktionen funktionieren.

Join The Future


HEUTE ABONNIEREN

Klar, prägnant, umfassend. Behalten Sie den Überblick über KI-Entwicklungen mit DailyAI

Eugene van der Watt

Eugene kommt aus der Elektronikbranche und liebt alles, was mit Technik zu tun hat. Wenn er eine Pause vom Konsum von KI-Nachrichten einlegt, findet man ihn am Snookertisch.

×

KOSTENLOSES PDF EXKLUSIV
Mit DailyAI immer einen Schritt voraus

Melden Sie sich für unseren wöchentlichen Newsletter an und erhalten Sie exklusiven Zugang zum neuesten eBook von DailyAI: 'Mastering AI Tools: Ihr Leitfaden für mehr Produktivität im Jahr 2024".

*Mit der Anmeldung zu unserem Newsletter akzeptieren Sie unsere Datenschutzbestimmungen und unsere Bedingungen und Konditionen