Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
NewsMaxine: Nvidia optimiert mit KI Videokonferenzen in der Cloud
Die Anzahl der Videokonferenzen über das Internet statt echten Meetings im Büro ist vor allem in Zeiten der COVID-19-Pandemie gestiegen. Anbietern entsprechender Lösungen bietet Nvidia mit Maxine nun eine Plattform an, die die Qualität von Videokonferenzen steigern und gleichzeitig den Traffic beim Streaming reduzieren soll.
Entwickler können Maxine aber auch dafür nutzen, um den Kopf eines Teilnehmers vollständig durch ein animiertes Avatar zu ersetzen, dessen Animationen in Echtzeit von den Mundbewegungen und Emotionen in der Tonlage beeinflusst werden.
Die Technologie finde ich spannend, würde ich persönlich aber nicht nutzen wollen. Die Bewegungen sehen halt deutlich gefaket aus, und die Zähne scheint sich der Algorithmus ja auch "auszudenken", wenn der Keyframe nicht während des Lächelns aufgenommen wurde.
Zudem wundert mich der Vergleich mit h264, selbst der Wechsel auf h265 kann bei gleichbleibender Qualität die Größe um die Hälfte reduzieren. Und auch allgemein mal nachgefragt: Gab es irgendwo echte Bandbreitenprobleme, dass man diese Lösung wirklich nutzen würde?
Mar1u5 schrieb:
Das wäre doch mal was, wenn man in seiner Muttersprache versehen und reden kann, das Gegenüber das aber übersetzt in eine andere Sprache bekommt.
Ich bin mir ziemlich sicher, dass Google solche Funktionen Richtung Echtzeit-Übersetzungen schon im Ofen hat. Wobei das thematisch ja doch noch ein gutes Stück von der News entfernt ist.
Wäre schön wenn die KI dafür sorgt dass man AFK gehen kann aber im Kamerabild trotzdem noch da ist, sich bewegt, und falls man angesprochen wird auch simple Dinge beantworten kann
Das würde die Bezeichnung künstliche Intelligenz auch verdienen.
Die KI muss dann nur noch die Klospülung aus dem Soundstream herausfiltern.
Da man aber auch aus dem Sound die Mundbewegung generieren kann, wäre es beispielsweise möglich ohne eingeschaltete Kamera eine Videokonferenz durchzuführen.
Gab es doch bei Skype schon oder habe ich da ein Fehler im Gedächtnis?
@Bright0001
Sind alles nur die Anfänge. Mal gucken wie es weiter geht 😅. Wenn dann alle Kameras erst Mal mit lidar gubt und nur noch die Bewegungen eines 3D models übertragen werden. Oder so ähnlich 😆
Augen1337 schrieb:
Die KI muss dann nur noch die Klospülung aus dem Soundstream herausfiltern.
Kann sie, musst Du nur Mal in den News suchen. Zu Corona Hochzeiten hat NV ein Audiooptimierungs-KI-Gedöns auf dem Markt gebracht. Das hat die Stimmen gefiltert und Nebengeräusche eliminiert. War auch für Streamer und Konferenzen gedacht 😉.
Naja, schon beim Original reden die Menschen wie Roboter.
Bei der Maske sieht es auch sehr komisch aus.
Ein Mittelding Bandbreite/ KI könnte funktionieren.
Wobei das System an die Software Entwickler gerichtet ist. Wenn es wer einsetzt werden wir es auch nutzen müssen