News Gemini Live: Gemini erhält eine Kamera- und Bild­­schirm­­­freigabe

mischaef

Kassettenkind
Teammitglied
Registriert
Aug. 2012
Beiträge
6.402
  • Gefällt mir
Reaktionen: aid0nex und knoxxi
Am besten hab ich dann auch schon einen Google Home Lautsprecher, der eh immer zuhört und überall Kameras im Haus, die alles filmen was noch so läuft. Ich versteh schon, das Gemini hier nur freigegebene Inhalte bekommt, aber Google gruselt mich einfach nur noch.
 
  • Gefällt mir
Reaktionen: aid0nex, Kalsarikännit, Triky313 und eine weitere Person
Die KI Stimme ist ja genauso furchtbar wie die YouTube Übersetzung. Das muss so ein Konzern doch besser hinbekommen.
 
@HageBen

Die Stimme ist auch in praktischer Benutzung viel besser als das hier gezeigte...schon merkwürdig das Video.

Und was Gemini eigentlich können sollte (aber immer noch nicht veröffentlicht wurde) ist das hier:

 
  • Gefällt mir
Reaktionen: ChrisMK72, chaopanda, Seven2758 und eine weitere Person
Die Stimme ist in echt auch deutlich besser. Google verkauft sich hier kein bisschen gut.
Das Feature kann ich mir aber als wirkliche Hilfe im Alltag vorstellen, nicht nur bei Auslandsreisen sondern auch als Accessibility Feature
 
wie nett ist kostenlos! man zahlt nur mit deinen wertvollen Daten, nichts weiter
 
  • Gefällt mir
Reaktionen: angband1, blende11, Nightmare85 und eine weitere Person
Ich denke das Video aus der News existiert nur in Englisch - und das Deutsch ist eine automatisierte Übersetzung von Youtube. Unter dem Zahnrad kann man eine Vielzahl an (automatisch generierten?) Sprachen einstellen:


Englisch klingt dann auch so wie es klingen soll und hat allgemein eine viel bessere Abmischung mit der Musik. Erklärt auch weshalb sich die Frau genauso anhört.

Anscheinend ist für deutsche User die deutsche Tonspur automatisch vorausgewählt. Da erweist sich Google bei der Qualität natürlich selbst einen Bärendienst.
 
  • Gefällt mir
Reaktionen: ChrisMK72 und mcbloch
Blaexe schrieb:
Und was Gemini eigentlich können sollte (aber immer noch nicht veröffentlicht wurde) ist das hier:
Ja, das ist Klasse. Ich habe da große Hoffnungen auch für Spiele, dass diese zukünftig recht einfach auch Lokalisierungen der Audioanteile für ziemlich jede Sprache anbieten können.

In English Training Sessions haben wir sowas auch schon mit CoPilot gemacht, da konnte man sich komplett mit der KI unterhalten, sieh hat einen korrigiert und man konnte wählen ob sie dies jetzt nett tut oder grantig ist usw. und konnte fliessend zwischen verschiedenen Sprachen wechseln.
 
  • Gefällt mir
Reaktionen: ChrisMK72 und knoxxi
Mit dieser lassen sich Kamerabilder und der Displayinhalt komfortabel zur weiteren Überwachung an Gemini weiterleiten.
 
Luxxxy schrieb:
Mit dieser lassen sich Kamerabilder und der Displayinhalt komfortabel zur weiteren Überwachung an Gemini weiterleiten.
Und schon wieder so ein Schwarzseher.
Du musst es ja nicht nutzen, dann hört dich auch keiner ab.
Ach ja, und willkommen in der modernen Welt.
 
Gemini" hat mich bei der Beantwortung meiner Fragen schon mehrmals getäuscht und sogar belogen.
Das Sprachmodell erfindet selbst unwahre Antworten und denkt sich eigene Geschichten aus, anstatt zu sagen, dass es etwas nicht weiß.
Der Einsatz von KI erfordert also höchste Vorsicht, bisher haben mich die Sprachmodelle nicht überzeugt.
Sie können nicht selbst denken, geschweige denn sich an Dinge erinnern, die man vorher mit ihnen gesprochen hat. Richtige Antworten, die man ihnen gibt, werden auch nicht gespeichert.
Was mich z.B. gestern in Bezug auf Datenschutz stutzig gemacht hat, war, dass die KI meinen Standort verwendet und erwähnt hat, obwohl ich ihn nicht angegeben und genannt hatte und danach gefragt habe. Auf die Frage, woher die KI meinen Standort kennt, hat sie behauptet, sie wüsste es nicht, obwohl sie ihn kannte und nannte.
Das gibt mir dann schon zu denken, was mit meinen privaten Daten passiert, wie sie ohne meine Zustimmung ausgewertet werden, wenn man KI einsetzt.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: shark808
blende11 schrieb:
Gemini" hat mich bei der Beantwortung meiner Fragen schon mehrmals getäuscht und sogar belogen.
Welches Gemini? 1.0? Ultra? Pro? 1.5? 2.0? Flash? Flash Thinking? 2.5 Pro?

Du siehst, so eine Aussage ist pauschal nicht viel wert weil es alle paar Monate signifikante Weiterentwicklungen gibt.
blende11 schrieb:
Das Sprachmodell erfindet selbst unwahre Antworten und denkt sich eigene Geschichten aus, anstatt zu sagen, dass es etwas nicht weiß.
Kommt leider immer noch vor, aber wird immer besser. Machen Menschen aber auch. Kennt wahrscheinlich jeder.
blende11 schrieb:
Sie können nicht selbst denken, geschweige denn sich an Dinge erinnern, die man vorher mit ihnen gesprochen hat.
Auch schon wieder veraltet:

https://blog.google/feed/gemini-referencing-past-chats/

Es ist ja grundsätzlich nicht falsch was du sagst, ich will nur die Geschwindigkeit der Weiterentwicklung heraus stellen. Die Erfahrungen von vor 3 Monaten könnten ggfs. heute schon nicht mehr relevant sein.
 
  • Gefällt mir
Reaktionen: blende11
Blaexe schrieb:
für deutsche User die deutsche Tonspur automatisch vorausgewählt
Das is mir in letzter Zeit schon öfter auf youtube unangenehm aufgefallen, da ich die automatische Stimme echt unangenehm finde.
Ich stelle immer sofort auf englisch/original um und atme durch. :) Wohltat!

Verstehe aber Leute, die kein englisch sprechen/verstehen, dass diese technische Innovation durchaus praktisch sein kann.

Hört sich in meinen Ohren nur halt schrecklich an. :D

Freue mich, dass diese Funktion für's 7 wohl kostenpflichtig sein wird. Hoffe, es wird dadurch weniger bei mir installiert. Am besten gar nix in der Richtung. ^^

Schätze aber das wird irgendwann auch bei älteren Pixeln ausgerollt.
Naja, Hauptsache ich kann bestimmte features blockieren/ausschalten.

Ich will nicht, dass ich auf einmal gefragt werden, ob ich weitere Informationen zu XY in meinem Bild haben will. ;) Am besten natürlich mit den "neuesten, besten Angeboten", inkl. Link dazu. 🤑

mcbloch schrieb:
willkommen in der modernen Welt
Irgendwann werd' ich mich wohl auch an sowas gewöhnen. ;)
 
Zuletzt bearbeitet: (typo)
@Blaexe
Die neueste Version von Gemini, sagt jedenfalls Gemini auf Nachfrage.
„Ich bin Gemini, die neueste Version von Googles großem Sprachmodell.“
(Stand heute 11.04.2025)
 
@blende11

Auch das sagt nicht tatsächlich etwas über das verwendete Sprachmodell aus. Ein eimmal trainiertes Modell wird wohl immer sagen dass es das Neueste ist. Und "neu" heißt auch nicht "besser." 2.5 Pro wird sicher besser sein als 2.5 Flash, auch wenn letzteres neuer ist.

Hab's gerade mal ausprobiert, die Modelle antworten eigentlich alle nur dass sie Sprachmodelle von Google sind und ständig weiterentwickelt werden.
 
  • Gefällt mir
Reaktionen: blende11
Was ich noch nicht ganz verstanden habe ist, warum Gemini manchmal auf English und manchmal auf deutsch antwortet, unabhängig von der Sprache, welche man beim fragen genutzt hat.
🤔

Die deutsche Sprachausgabe ist echt gut. Die englische dagegen hört sich irgendwie künstlich an.
 
Zurück
Oben