Authentische KI-Gespräche: Erweiterter Sprachmodus von ChatGPT in der EU verfügbar

Andreas Frischholz
28 Kommentare
Authentische KI-Gespräche: Erweiterter Sprachmodus von ChatGPT in der EU verfügbar
Bild: OpenAI

Der fortgeschrittene Sprachmodus von ChatGPT ist nun für alle Nutzer in der EU sowie Schweiz, Norwegen, Island und Liechtenstein verfügbar, bestätigte OpenAI auf X. Der neue Sprachmodus ermöglicht Gespräche mit dem KI-Chatbot, die authentischer als bisher wirken sollen.

Voraussetzung ist ein Plus- oder Team-Abonnement, Nutzer der kostenfreien Variante haben keinen Zugriff. Öffnen lässt sich der neue Sprachmodus, indem man in der App unten rechts auf das Symbol klickt. Beim ersten Start erhält man zunächst allgemeine Informationen und kann zwischen neun Stimmen auswählen, die sich in der Tonalität unterscheiden, indem sie etwa ruhiger oder fröhlicher ausfallen sollen.

Technische Grundlage ist das GPT-4o-Modell. Ob der neue Sprachmodus aktiv ist, erkennt man an der blauen Kugel in der Mittel des Bildschirms. Beim Standard-Sprachmodus ist es eine schwarze Kugel. Die tägliche Nutzung ist derzeit begrenzt. Nutzer werden von der App informiert, wenn sie noch 15 Minuten Zeit haben.

Emotionen und Sprechpausen

Relevant für die authentischer wirkenden Gespräche sind zunächst die Reaktionszeiten, Antworten sollen möglichst in Echtzeit kommen. Konkret heißt das: Der Chatbot benötigt keine zwei bis fünf Sekunden, um eine Antwort zu generieren, sondern laut den Angaben von OpenAI durchschnittlich 320 Millisekunden. Diese Reaktionszeit entspricht der von Menschen. Authentischer wirkt der Chatbot zudem, indem die Antworten mit Sprechpausen und Emotionen erfolgen. So sind etwa humorvolle oder überrascht wirkende Antworten möglich.

Zusätzlich haben Nutzer die Möglichkeit, den Chatbot zu personalisieren. Dafür nutzt ChatGPT die Informationen, die in den Hinweisen und Erinnerungen hinterlegt sind. Es sind also bereits bekannte ChatGPT-Funktionen, die den KI-Assistenten zum nützlichen Alltagshelfer machen sollen.

Nun kommen Funktionen, die im Frühjahr angekündigt worden sind

Vorgestellt hatte OpenAI den neuen Sprachmodus bei dem Spring Event im Mai. Damals sorgten die Präsentationen für Aufsehen, vor allem die emotional wirkenden Antworten waren in dieser Form neu. Über den Sommer hinweg verzögerte sich der Start aber mehrfach. So sollte etwa sichergestellt werden, dass der Sprachmodus bei bestimmten Inhalten keine Antworten gibt.

Meldungen zum fortgeschrittenen Sprachmodus

Eine weitere Ankündigung bei dem Spring Event war der Kamera-Modus, durch den ChatGPT in der Lage ist, die Kamera als Eingabefenster zu nutzen und Informationen in Echtzeit zu verarbeiten. So kann der Chatbot also verarbeiten, was in einem Raum passiert. Diese Funktion lässt bei OpenAI aber weiter auf sich warten. Microsoft hat mit Copilot Vision zumindest schon einen Starttermin in Aussicht gestellt.

Kritik gab es zudem an der Geschwindigkeit der Entwicklung. Weil die OpenAI-Führungsriege das Modell GPT-4o unbedingt vor Googles Entwicklerkonferenz vorstellen wollte – dort wurde ein ähnlicher Sprachmodus präsentiert –, soll es intern enormen Druck auf die Sicherheitsabteilung gegeben haben. OpenAI bestreitet diese Vorwürfe und spricht von einem neuen Verfahren bei den Sicherheitschecks, das Probleme bereitet habe.

Snapdragon Summit 2024 (21.–23. Oktober 2024): Alle News auf der Themenseite!