3D-GPT erzeugt 3D-Umgebungen aus Texteingaben

Oktober 22, 2023

3D-KI

Im Rahmen einer Zusammenarbeit zwischen der Australian National University, der University of Oxford und der Beijing Academy of AI haben Forscher ein KI-System namens "3D-GPT" vorgestellt. 

Diese ausgeklügelte Reihe von KI-Agenten ermöglicht die Erzeugung von 3D-Umgebungen durch einfache Texteingaben.

Das Papier, verfügbar auf arXivzeigt einen schlanken und benutzerfreundlichen Ansatz für die Erstellung von 3D-Assets, der im Gegensatz zu den komplizierten Arbeitsabläufen bei der herkömmlichen 3D-Modellierung steht.

Durch die einfache Beschreibung einer Umgebung wie "schneebedeckter Gipfel mit strahlendem Sonnenschein im Hintergrund" wird das KI-System die Beschreibung der Umgebung interpretieren und ausbauen und daraus einen Code generieren, der in eine 3D-Computergrafiksoftware wie Blender eingegeben werden kann. 

3D-GPT unterteilt komplexe 3D-Modellierungsaufgaben in überschaubare Segmente und delegiert jedes Segment an spezialisierte KI-Agenten.

Der Agent hat die folgenden Aufgaben:

  1. Aufgabenverteilungsagent: Interpretiert die vom Benutzer eingegebenen Textanweisungen.
  2. Konzeptualisierungsagent: Erweitert die ursprüngliche Beschreibung, indem fehlende Details ergänzt werden.
  3. Modellierungsagent: Legt die erforderlichen Parameter fest und generiert Code zur Bearbeitung von 3D-Software wie Blender.

Mithilfe dieser agentenbasierten Struktur kann 3D-GPT Texteingaben interpretieren, Beschreibungen mit zusätzlichem Kontext ergänzen und 3D-Assets erstellen, die sich eng an den Vorstellungen des Benutzers orientieren.

3D-GPT
3D-GPT's Pipeline für die Umwandlung von Texteingaben in 3D-Grafiken. Quelle: ArXiv.

Text in 3D-Welten verwandeln

In dem Papier wird beschrieben, wie 3D-GPT eine einfache Textaufforderung wie "ein nebliger Frühlingsmorgen, an dem taufrische Blumen eine üppige, von knospenden Bäumen umgebene Wiese schmücken" zum Leben erwecken und eine reichhaltige 3D-Szene mit realistischen Grafiken erzeugen kann. 

Obwohl die Technologie noch nicht das Stadium des Fotorealismus erreicht hat, sind die Ergebnisse vielversprechend.

Die Forscher blicken optimistisch in die Zukunft: "Unsere empirischen Untersuchungen bestätigen, dass 3D-GPT nicht nur Anweisungen interpretiert und ausführt und dabei zuverlässige Ergebnisse liefert, sondern auch effektiv mit menschlichen Designern zusammenarbeitet." 

Sie sind der Meinung, dass ihr System "das Potenzial von LLMs in der 3D-Modellierung hervorhebt und einen grundlegenden Rahmen für zukünftige Fortschritte in der Szenengenerierung und Animation bietet".

In dem Maße, wie Technologien wie das Metaverse an Fahrt gewinnen, könnten Werkzeuge wie 3D-GPT unverzichtbar werden. 

Mögliche Anwendungen gibt es in vielen Branchen, darunter Spiele, virtuelle Realität, Kino und Multimedia-Erlebnisse, wodurch die Erstellung von 3D-Inhalten effizienter und zugänglicher wird. 

3D-GPT könnte bei Designern von Videospielen und 3D-Modellierern die Alarmglocken läuten lassen, die bereits von ähnlichen, in beliebte Designplattformen wie Unity integrierten Tools angegriffen werden.

Join The Future


HEUTE ABONNIEREN

Klar, prägnant, umfassend. Behalten Sie den Überblick über KI-Entwicklungen mit DailyAI

Sam Jeans

Sam ist ein Wissenschafts- und Technologiewissenschaftler, der in verschiedenen KI-Startups gearbeitet hat. Wenn er nicht gerade schreibt, liest er medizinische Fachzeitschriften oder kramt in Kisten mit Schallplatten.

×

KOSTENLOSES PDF EXKLUSIV
Mit DailyAI immer einen Schritt voraus

Melden Sie sich für unseren wöchentlichen Newsletter an und erhalten Sie exklusiven Zugang zum neuesten eBook von DailyAI: 'Mastering AI Tools: Ihr Leitfaden für mehr Produktivität im Jahr 2024".

*Mit der Anmeldung zu unserem Newsletter akzeptieren Sie unsere Datenschutzbestimmungen und unsere Bedingungen und Konditionen