Google Cloud Next 2025: Gemini 2.5 Flash angekün­digt, Veo 2 allgemein verfügbar

Michael Schäfer
14 Kommentare
Google Cloud Next 2025: Gemini 2.5 Flash angekün­digt, Veo 2 allgemein verfügbar
Bild: Google Deepmind

Google hat auf der derzeit stattfindenden Hausmesse Cloud Next 2025 die baldige Verfügbarkeit von Gemini 2.5 Flash angekündigt. Gleiches gilt für das Videogenerierungsmodell Veo 2, das Teil des Google AI Studio wird, wie auch die demnächst als Vorschau verfügbare Live-API für Gemini zur Unterstützung von Echtzeit-Interaktionen.

Veo 2 noch mit Einschränkungen

Im Rahmen der Veranstaltung hat Google weitere Einblicke in das Videogenerierungsmodell Veo 2 gegeben, das nun als produktionsreif eingestuft und ab sofort über die Gemini-API im Google AI Studio allgemein bereitgestellt wird. Veo 2 soll laut Google in der Lage sein, „sowohl einfache als auch komplexe Anweisungen zu befolgen und die reale Physik in einer Vielzahl von visuellen Stilen zu simulieren“. Das Modell lässt sich mittels Texteingaben, Bildanweisungen oder einer Kombination aus beiden steuern. Nutzer können also durch eine textuelle Beschreibung oder ein zur Verfügung gestelltes Bild festlegen, was erstellt werden soll – oder beides miteinander kombinieren.

Das neue Modul ist ab sofort im Google AI Studio integriert und kann dort getestet werden. Die Videos werden derzeit mit einer maximalen Auflösung von 720p bei 24 Bildern pro Sekunde erzeugt. Hinsichtlich der Länge bestehen weiterhin Einschränkungen, aktuell sind nur Videos mit einer Dauer von bis zu acht Sekunden möglich. Für die Nutzung im Unternehmensumfeld verlangt Google eine Gebühr in Höhe von 0,35 US-Dollar pro Sekunde generierten Videomaterials.

Gemini Flash 2.5 Flash bald verfügbar

Google kündigte darüber hinaus an, dass das für grundlegende Aufgaben optimierte Denkmodell Gemini 2.5 Flash in Kürze verfügbar sein wird. Die neue Modellfamilie Gemini 2.5 wurde bereits im vergangenen Monat vorgestellt und ist in der Variante Gemini 2.5 Pro als experimentelle Version zunächst exklusiv für Abonnenten verfügbar gewesen. Diese Version hat sich seitdem in hohem Tempo weiterentwickelt. „Diese Weiterentwicklung unseres beliebten Arbeitsmodells wird niedrige Latenzzeiten und Kosteneffizienz beibehalten und gleichzeitig neue Denkfähigkeiten einbeziehen“, erklärte das Unternehmen.

Zudem wurde angekündigt, dass die Live-API für Gemini nun in einer Vorschauversion bereitsteht. Dieses KI-Modell soll Echtzeit-Interaktionen unterstützen und „ermöglicht es Entwicklern, Anwendungen und Agenten zu erstellen, die Streaming-Audio, Video und Text mit geringer Latenz verarbeiten“.

Unsere Bots RTX 50 kaufen und RX 9000 kaufen bieten jetzt einen Filter auf Deals⭐ und zeigen den Preistrend📉.