ChatGPT: Neue Funktionen für Sprach- und Bilderkennung
OpenAI hat neue Funktionen für ChatGPT vorgestellt, mit denen der AI-Bot nun auch Sprach- und Bilderkennung beherrscht. Die Funktionen sind ab sofort für Nutzer von ChatGPT Plus und ChatGPT Enterprise verfügbar.
ChatGPT kann nun über eine neue Schnittstelle gesteuert werden, die es den Nutzern erleichtert, einen verbalen Dialog mit dem AI-Bot zu führen. Die Sprachfunktion ist sowohl für Android als auch für iOS verfügbar, allerdings müssen die Nutzerinnen und Nutzer diese in den Einstellungen aktivieren.
ChatGPT bietet fünf verschiedene Stimmen zur Auswahl an. Die Stimmen basieren auf einem neuen Sprachsynthese-Modell, das mit professionellen Sprechern trainiert wurde. ChatGPT kann auch gesprochene Konversationen in Text umwandeln.
Nutzerinnen und Nutzer von ChatGPT können dem KI-Bot nun auch Bilder zeigen und Fragen dazu stellen. In der mobilen Anwendung können Nutzer auch bestimmte Bildbereiche markieren, wenn sie darüber sprechen möchten.
OpenAI hat technische Vorkehrungen getroffen, um zu verhindern, dass ChatGPT zu weit geht, wenn es um Personen auf Fotos geht.
OpenAI weist darauf hin, dass ChatGPT derzeit nur in Englisch sehr gute Ergebnisse erzielt und in einigen anderen Sprachen noch schlecht abschneidet. Es wird daher empfohlen, die Spracherkennung derzeit nur in Englisch zu verwenden.
Quelle(n):
OpenAI
Links mit einem * sind Partner-Links. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalte ich eine kleine Provision. Für euch ändert sich am Preis nichts. Danke für eure Unterstützung!
Um über alle News auf dem Laufenden zu bleiben, folge mir auf Google News oder Telegram, WhatsApp, Mastodon, Threads, Bluesky oder auf Facebook oder abonniere meinen RSS-Feed!