OpenAI enthüllt neue Sprach- und Bildfunktionen für ChatGPT

25. September 2023

ChatGPT

OpenAI hat Sprach- und Bildfunktionen für ChatGPT vorgestellt, die in den kommenden Wochen sowohl für die App als auch für den Browser eingeführt werden sollen.  

Man kann mit Fug und Recht behaupten, dass sich OpenAI mit ChatGPT auf seinen Lorbeeren ausgeruht hat. Das Programm bietet nicht ganz den gleichen Funktionsumfang wie die Konkurrenten Claude von Anthropic und Bard von Google.

OpenAI fügte Anfang des Jahres eine Browser-Suchfunktion für ChatGPT hinzu, die dem Tool Zugriff auf das Internet gewährte, aber sie funktionierte nicht besonders gut und war entfernt wegen möglicher Verletzung von Urheberrechten durch das "Ausdrucken" von Texten aus kostenpflichtigen Websites. 

Damit ist GPT-4 das bei weitem komplexeste große Sprachmodell (LLM) auf dem Markt, das OpenAI an der Spitze der generativen KI hält. 

OpenAI hat nun die Funktionalität des Chatbots erweitert und hält ChatGPT fest im Rampenlicht, da der Wettbewerb in der Branche immer härter wird.

Was gibt es Neues?

OpenAI fügt dem ChatGPT Folgendes hinzu:

  • Sprachliche Interaktion: Die Nutzer können nun direkt mit ChatGPT sprechen, und die KI kann im Gegenzug mit einer ihrer fünf synthetischen Stimmen antworten. Diese Sprachfunktion wird durch ein fortschrittliches Text-to-Speech-Modell unterstützt, das OpenAI anhand von Sprachproben von Schauspielern trainiert hat. ChatGPT nutzt Flüstern, das Open-Source-Spracherkennungssystem von OpenAI.
  • Bild-Interaktion: Neben der Sprache können die Nutzer ChatGPT jetzt auch Bilder zur Verfügung stellen, um der Konversation eine visuelle Dimension zu verleihen. Wenn ein Nutzer beispielsweise ein Foto eines kaputten Geräts mitteilt, kann ChatGPT das Problem möglicherweise diagnostizieren und Lösungen vorschlagen. Auf mobilen Plattformen wurde ein Zeichentool integriert, mit dem die Nutzer bestimmte Bereiche eines Bildes einkreisen oder markieren können, auf die sich die KI dann konzentrieren soll. Die Bildfunktionen werden von einer multimodalen Version der Modelle GPT-3.5 und GPT-4 gesteuert, die auf die Interpretation und Auswertung visueller Eingaben abgestimmt wurden.

Mit diesen neuen Funktionen können die Nutzer eine Unterhaltung mit dem Chatbot führen und ihn u. a. um spezifische Informationen zu Bildinhalten bitten.

Es besteht kein Zweifel, dass die Community interessante Wege finden wird, um die Grenzen des neuen ChatGPT zu testen.

OpenAI hat die folgende Werbedemo auf X veröffentlicht:

Risiken und Einführungsplan

Mit neuen Funktionen kommen neue Risiken. So könnte die Sprachtechnologie beispielsweise dazu missbraucht werden, sich als Personen des öffentlichen Lebens auszugeben. Als Vorsichtsmaßnahme hat OpenAI die Sprachfunktion auf Konversations-Chats beschränkt.

Was Bilder betrifft, so hat OpenAI die Fähigkeit von ChatGPT, Menschen auf Fotos direkt zu analysieren, bewusst eingeschränkt. 

OpenAI plant eine schrittweise Einführung, wobei ChatGPT Plus- und Enterprise-Benutzer als erste Zugang erhalten werden. 

Die Sprachfunktion wird auf mobilen Anwendungen verfügbar sein, während die Bildfunktionen auf allen Plattformen zugänglich sein werden.

Die Ankündigung von OpenAI reiht sich ein in eine Reihe aktueller und bevorstehender Veröffentlichungen generativer KI-Produkte, darunter Tools von YouTube, Microsofts Copilot eine Reihe von KI-Tools und Assistenten sowie eine bedeutende Aktualisierung von Google Bard.

Join The Future


HEUTE ABONNIEREN

Klar, prägnant, umfassend. Behalten Sie den Überblick über KI-Entwicklungen mit DailyAI

Sam Jeans

Sam ist ein Wissenschafts- und Technologiewissenschaftler, der in verschiedenen KI-Startups gearbeitet hat. Wenn er nicht gerade schreibt, liest er medizinische Fachzeitschriften oder kramt in Kisten mit Schallplatten.

×

KOSTENLOSES PDF EXKLUSIV
Mit DailyAI immer einen Schritt voraus

Melden Sie sich für unseren wöchentlichen Newsletter an und erhalten Sie exklusiven Zugang zum neuesten eBook von DailyAI: 'Mastering AI Tools: Ihr Leitfaden für mehr Produktivität im Jahr 2024".

*Mit der Anmeldung zu unserem Newsletter akzeptieren Sie unsere Datenschutzbestimmungen und unsere Bedingungen und Konditionen