News Microsoft: VASA-1 erzeugt lebensechte Videos aus einem Bild plus Ton

nlr

Redakteur
Teammitglied
Registriert
Sep. 2005
Beiträge
9.996
Immer neue KI-Modelle und AI-Forschungsprojekte schrauben die Anforderungen für realistische und lebensechte Videos stetig weiter nach unten. Bei Microsofts VASA-1 genügt jetzt ein einziges Bild plus Ton, um daraus ein lebensechtes Avatar als Video zu kreieren. Im Gegensatz zur Sora lässt sich VASA-1 sogar in Echtzeit ausführen.

Zur News: Microsoft: VASA-1 erzeugt lebensechte Videos aus einem Bild plus Ton
 
  • Gefällt mir
Reaktionen: aid0nex, -Stealth-, Strahltriebwerk und 11 andere
Ein Hoch auf unsere künftigen KI-Overlords...
Die Deepfake Fetisischten werden das feiern, endlich P0rn von und für jeden :volllol:
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: jonderson, aid0nex, marzk und 64 andere
Was ich mich da immer frage, wozu braucht man sowas? Wo liegt dabei eine sinnvolle Nutzung? Was geht damit besser oder leichter. Außer eben Deepfakes zu erstellen.

Das erwähnte Beispiel Teams überzeugt mich nicht so, da kann man auch einfach die Cam nutzen und wenn man das nicht will, warum dann so einen Real-Life Avatar?

Also toll, was alles möglich ist, aber nicht alles was möglich ist, ist auch sinnvoll oder bringt einen Nutzen. Und es nur zu tun, weil es möglich ist? Ick weeß nich.
 
  • Gefällt mir
Reaktionen: aid0nex, flo.murr, fullnewb und 30 andere
Faszinierend und extrem creepy zugleich, gemessen an den Massen an Falschmeldungen und Shitstorms, mit denen man sich speziell im Netz heutzutage schon abfinden muss.

Gestern oder vorgestern hattet Ihr doch einen Artikel über dieses Horrorspiel, wo die Entwickler auf A.I. setzen wollen.

Für Spieleentwicklung und Filmschaffung würde ich so etwas nach wie vor sehr interessant finden, diese kleinen, Passfotos im Grunde genommen, aus denen diese Clips entstanden, könnte man in Weltraum Simulationen etwa für Assistenten oder Videocalls benutzen, wenn es in der Story voran geht.

Aber vielleicht male ich mir da zu viel aus, einen Platz dafür kann ich schon sehen, allerdings auch nur, wenn auf die Regularien geachtet wird.
 
  • Gefällt mir
Reaktionen: -Stealth-, flo.murr, mtmac und 11 andere
habla2k schrieb:
Was ich mich da immer frage, wozu braucht man sowas? Wo liegt dabei eine sinnvolle Nutzung? Was geht damit besser oder leichter. Außer eben Deepfakes zu erstellen.

Du unterschätzt wie mächtig Deepfakes sind.
 
  • Gefällt mir
Reaktionen: aid0nex, H3llF15H, knoxxi und 5 andere
habla2k schrieb:
Was ich mich da immer frage, wozu braucht man sowas? Wo liegt dabei eine sinnvolle Nutzung? Was geht damit besser oder leichter. Außer eben Deepfakes zu erstellen.

Das erwähnte Beispiel Teams überzeugt mich nicht so, da kann man auch einfach die Cam nutzen und wenn man das nicht will, warum dann so einen Real-Life Avatar?
Für Kriminelle?
 
  • Gefällt mir
Reaktionen: Rassnahr, Sardok, shaadar und 2 andere
Wow, da möchte man doch gleich eine komplette Welle an Fake-Kickstarterprojekten prophezeihen, denen ein per KI generierter "Mensch" vorgestellt wird.
 
  • Gefällt mir
Reaktionen: Haldi und R O G E R
Ich sehe schon die erste Betrugsmaschen.

Hallo ich bin ihr neuer Online Bankberater, ihr Konto wurde gesperrt, bitte Aktivieren Sie ihr Konto erneut, drücken Sie...
1 per SMS
2 Konto sofort Leerräumen
3 Dankeschön
 
  • Gefällt mir
Reaktionen: Strahltriebwerk, shaadar und n8mahr
Ich mein cool das das geht, ist bestimmt crazy viel Wissen und Können dafür nötig. Aber braucht es das wirklich, damit kannst doch gefühlt mehr Schabernack treiben als sinnvolle Dinge.
Mir fallen halt nur Gründe ein damit irgendwie Blödsinn zu treiben.
 
  • Gefällt mir
Reaktionen: LencoX2, Sardok, Weyoun und 2 andere
Damien White schrieb:
Überhaupt nicht, aber warum erfindet man etwas, das nur dazu dient Fälschungen besser zu machen. Also, der Sinn kann ja kaum sein Fälschungen zu erstellen, die vom echten nicht mehr zu unterscheiden sind, denn wofür soll man sowas nutzen, außer für Unrecht.

Also, wenn, dann unterschätze ich höchsten den Willen von (namhaften) Firmen Tools für Betrug zu erstellen.
 
  • Gefällt mir
Reaktionen: sandcrawler, Rassnahr, Sardok und 2 andere
Vor allem, dass es in Echtzeit ausgeführt werden kann, finde ich krass :o
 
  • Gefällt mir
Reaktionen: aid0nex, EUROFlGHTER, Charminbaer und 3 andere
Auf technischer Basis ist das schon ne Nummer. Ich bin gespannt, wann endlich das Uncanny Valley überwunden wird, aber scheinbar stehen wir kurz davor. In allen im Artikel verlinkten Videos gibt es immer noch die typischen, sehr awkward wirkenden Bewegungen und teils auch Mimiken... die Dame ganz oben hat zudem sehr, seeeeeeeehr viele Schneide- und Eckzähne (dafür keine Backenzähne, cool ^^).

Wie gesagt, in Details sieht man es schon noch. Auch der Shiny Potato Mode trägt nicht gerade zum "perfekten" Bild bei, aber erneut: wir stehen wohl kurz davor, dass mittels Software selbst ein Handy in der Hosentasche in der Lage sein wird, Videos aus dem Nichts zu erzeugen, die von der Realität nicht mehr zu unterscheiden sind.

Technisch: höchst beeindruckend
Sozialwissenschaftlich: höchst bedenklich
 
  • Gefällt mir
Reaktionen: Lockenmonster, Sascha631, floTTes und 12 andere
habla2k schrieb:
Überhaupt nicht, aber warum erfindet man etwas, das nur dazu dient Fälschungen besser zu machen. Also, der Sinn kann ja kaum sein Fälschungen zu erstellen, die vom echten nicht mehr zu unterscheiden sind, denn wofür soll man sowas nutzen, außer für Unrecht.
Warum? Weil man es kann und die Rechtslage halt dauerhaft im Prüfmodus versickert... ätzend, dass der Knall hier nicht gehört wird und AI (auch weils viel zuviel Energie frisst) endlich verboten wird.
 
  • Gefällt mir
Reaktionen: Sardok, jabberwalky und habla2k
habla2k schrieb:
Was ich mich da immer frage, wozu braucht man sowas? Wo liegt dabei eine sinnvolle Nutzung? Was geht damit besser oder leichter.
Tatsächlich fällt es Menschen leichter, jemanden zu verstehen, wenn sie ihn sehen können. Viele sehen auf den Mund, um der Stimme zu folgen und mindestens unterbewusst wird auch die Mimik betrachtet.
Abseits davon gibt es sicher auch in der Video- sowie Videospielindustrie(!) Interesse an dieser Technik.

Davon mal abgesehen:
Bin ich der Einzige, der bei diesen Beispielvideos voll in das Uncanny Valley fällt? Die ganze Gesichtsgeometrie ist irgendwie nicht stabil und verändert sich laufend. Am einfachsten sieht man das bei dem zweiten Video (das vom Mann) an der Frisur. Auch die Mimik insbesondere um die Augen herum passt nicht.
 
  • Gefällt mir
Reaktionen: Project 2501, guzzisti, Charminbaer und 3 andere
Das größte Problem an Deepfakes ist ja eher das Leute alles einfach für Bare Münze nehmen und sofort Mistgabeln und Fackeln rausholen.
 
  • Gefällt mir
Reaktionen: sandcrawler, Fritzler, Nefcairon und 20 andere
Dann gibts ja bald ganz viele Videos auf YT wo uns irgendein Promi sein exklusives Geheimnis verrät, wie er mit Crypto 10000% Rendite erwirtschaftet :D

Aber im Ernst, Moderator ist dann wohl auch kein zukunftsfähiger Job mehr. Die Redaktionen kann man ja auch schon durch KI ersetzen, wenn man es mit der Wahrheit nicht ganz so eng sieht.
 
  • Gefällt mir
Reaktionen: Strahltriebwerk, locke87, Sardok und 6 andere
Ihr DHL Paket konnte nicht zugestellt werden, Grund fehlende Bankverbindung, hier ihre Bankverbindung hinterlegen.

Dankeschön
 
habla2k schrieb:
Was ich mich da immer frage, wozu braucht man sowas? Wo liegt dabei eine sinnvolle Nutzung? Was geht damit besser oder leichter. Außer eben Deepfakes zu erstellen.


z.B. extrem effiziente Datenübertragung.

Wenn du aus einem Bild und etwas Text ein fotorealistisches Video mit lebensechten Animationen und Sprache synthetisieren kannst, dann kannst du die Datenmenge um mehrere Größenordnungen schrumpfen.

Das ganze wäre in Zukunft auch für Spiele oder intearaktive virtuelle Welten interessant.

Zumal Technologie immer gegenseitig aufeinander aufbaut. Für die Mathematischen Grundlagen von KI gab es auch jahrzehnte Lange keinen Anwendungsfall und wurde als Zahlenspielerei gesehen. Und jetzt sieh dir an, was daraus entstanden ist und wie viel Geld in diesem Markt steckt.
 
  • Gefällt mir
Reaktionen: Hal14, Nefcairon, floTTes und 7 andere
Nitschi66 schrieb:
Es ist wirklich unfassbar wie "einfach" das heutzutage mit den richtigen Tools geht.
Vor allem wie einfach man an die Hardware kommt.

Gut, zahlste halt mal ~2000€ für Jensons noch aktuelles consumer flagship, aber danach stehen Dir Tür und Angel offen.

Und ich lache noch über den Schwachsinn, den ich bei genügend Freizeit mit Stable Diffusion und meiner 5700 machen kann.
 
  • Gefällt mir
Reaktionen: nyster und Nitschi66
Zurück
Oben