Smartphone als Assistent: Gemini Live führt Echtzeitgespräche und integriert zahlreiche Dienste

Andreas Frischholz
12 Kommentare
Smartphone als Assistent: Gemini Live führt Echtzeitgespräche und integriert zahlreiche Dienste
Bild: Gemini

Mit der Vorstellung der Pixel-9-Reihe erhält auch der generative AI-Chatbot Gemini ein Upgrade von Google. Mehr Funktionen, Gespräche in Echtzeit – im Kern soll Gemini (Advanced) das Smartphone zum Alltagsassistenten verwandeln.

Die Echtzeitgespräche laufen unter dem Titel Gemini Live, Nutzer der kostenpflichtigen Advanced-Version von Gemini können laut Google so natürliche Gespräche mit dem Assistenten führen. Der Clou sind die schnellen Reaktionszeiten des Chatbots, der sich auch mitten im Satz unterbrechen lässt, um etwa Zwischenfragen zu stellen.

Was Google präsentiert, ist also eine Antwort auf den neuen Sprachmodus von ChatGPT, der auf GPT-4o basiert. Während sich OpenAIs neuer Sprachmodus aber noch in der Alpha-Phase befindet, ist Gemini Live auf Englisch für Advanced-Kunden verfügbar. Aktuell gilt das für alle Android-Geräte, in den kommenden Wochen soll die Unterstützung für die iOS-App sowie für weitere Sprachen folgen.

Smartphone mit natürlicher Sprache steuern

Google erweitert zusätzlich den Funktionsumfang, um Gemini immer mehr als Alltagsassistent zu positionieren, der jederzeit verfügbar ist. So werden immer mehr Google-Apps und -Dienste in die Gemini-App integriert, sodass sich diese nutzen lassen, ohne zwischen den Apps und Diensten zu wechseln. So ist es etwa anhand von Informationen aus E-Mails möglich, eine Einkaufsliste erstellen zu lassen oder Vorschläge aus Google Maps auszugeben.

In den kommenden Wochen sollen zusätzliche Erweiterungen folgen, darunter Notizen, der Kalender, die Gerätesteuerung und erweiterte Funktionen für YouTube Music. Mit der Gerätesteuerung lassen sich etwa die Uhr inklusive Timer und Alarme, Medien-Dienste sowie Gerätefunktionen wie Taschenlampe, Lautstärke, WLAN und Bluetooth kontrollieren. Googles KI-Dienste werden also immer tiefer in Android verankert.

Gemini soll generell die Bedienung erleichtern, selbst wenn man das Smartphone nicht in der Hand hat. So ist es etwa möglich, sich mit dem Chatbot auszutauschen, wenn die Gemini-App nur im Hintergrund läuft oder das Display gesperrt ist. Abonnenten von Google One AI Premium erhalten zusätzlich die Option, Fragen zu Bildschirminhalten zu stellen. So lassen sich etwa Informationen zu einem YouTube-Video abrufen.

Welche KI-Funktionen verfügbar sind, ist also abhängig von den unterstützten Geräten, der Sprache und dem jeweiligen Abo-Paket. Premium-Modelle bieten generell mehr Funktionen, ältere Geräte sollen im Laufe der Zeit aber ebenfalls Updates erhalten. Foldables wie das Samsung Galaxy Z Fold 6 (Test) werden ebenfalls unterstützt. Auf der Pixel-9-Reihe ist Gemini als Standard-Assistent vorgesehen.

Gemini Nano läuft direkt auf dem Gerät

Die neuen Gemini-Funktionen basieren auf Googles aktuellen KI-Modellen. Gemini 1.5 Flash ist etwa auf besonders schnelle Antwortzeiten ausgelegt. Gemini Nano ermöglicht den Betrieb des Large Language Models (LLM) direkt auf dem Gerät, bei besonders sensiblen Aufgaben sollen Daten damit nie das Smartphone verlassen.

Generell betont Google, wie groß der Wert von Datenschutz sei. So sei etwa die Erlaubnis des Nutzers erforderlich, damit Gemini bei Antworten die relevanten persönlichen Informationen mit dem Wissen verknüpft, das Google bereitstellt.