Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
TestNvidia Broadcast 2.0 im Test: Die neue KI-Studio-Sprachaufnahme ausprobiert
Parallel zu RTX 50 und neuen Grafiktreibern ist Nvidia Broadcast in Version 2.0 erschienen. Mit von der Partie ist das Beta-Feature Studio-Sprachaufnahme, mit dem Nutzer die Qualität ihres Mikrofons auf das Niveau eines High-End-Tonstudios anheben können sollen. ComputerBase hat die neue Funktion ausprobiert.
Also rein von der Verständlichkeit finde ich die native Aufnahme besser, und zwar deutlich.
Die "Studio" Version klingt, als wären teilweise am Ende eines gesprochenen Wortes ein paar zentel(milli?)Sekunden abgeschnitten.
Ist schwierig zu beschreiben, aber der nativen Aufnahme kann ich viel leichter folgen.
Also ich finde das eher unangenehm und zu künstlich. Beim Broadcast könnt ihr dann auch einfach nur noch TextToSpeech an machen, will dann keiner mehr hören. Am Ende ists dann eh AI Fake.
Wer sich so eine GPU leistet und dann mit Müllmic kommt ist sowieso Fail.
Irgendwie klingen die Studio-Aufnahmen einfach nur danach, als wären sie durch eine großzügige Rauschunterdrückung gegangen...
Dass man dafür "KI-Funktionen" nutzen "muss" ist also wohl eher Marketing als irgendwas anderes...
Tatsächlich fand ich persönlich alle Aufnahmen ohne das Feature irgendwie angenehmer weil klarer!
Wobei ich mir vorstellen kann, das die Aufnahme mit dem Feature tatsächlich auf Dauer angenehmer sein könnte! Im vergleich hört es sich dumpfer an, aber auch irgendwie professioneller! Eher nach Hörbuch
Mich interessiert das Thema nicht so wirklich, ich wollte aber mal das Thumbnail des Artikels lobend erwähnen: Es hat mir ein Schmunzeln ins Gesicht gezaubert
Interessant wäre ein Vergleich, wenn integrierte Mikrofone genutzt werden. Laptopmikros, Webcammikros, Handymikros, ...
Vielleicht werden die wirklich schlechten Aufnahmen wesentlich besser.
bei meiner Creative-Soundkarte kann ich einstellen, dass meine Stimme wie ein "Elf" oder ein "Ork" klingen soll. Ganz ohne KI und 300W Leistungsaufnahme.
Klingt halt auch nicht besser, nur anders. 🤷♂️ /S
PS: finde diese Technik von NV prinzipiell gut, aber beim derzeitigen Stand von Leistungsaufnahme und Ergebnis ist es Spielerei, nix anderes.
Also ich finde das eher unangenehm und zu künstlich. Beim Broadcast könnt ihr dann auch einfach nur noch TextToSpeech an machen, will dann keiner mehr hören. Am Ende ists dann eh AI Fake.
Wer sich so eine GPU leistet und dann mit Müllmic kommt ist sowieso Fail.
Krass welche Anforderungen das hat. Ein Audioprogramm und 2-3 VST brauchen auf aktuellen Systemen vielleicht 3-4 % leistung des Rechners. Völliger Witz was Nvidia da abliefert. Bananensoftware.
Mich überzeugt das ehrlich gesagt gar nicht. Zum Einen hört es sich im ersten Beispiel so an, als würde eine ganz andere Person sprechen und zum Anderen kann man "Artefakte" hören, die man von bisherigen AI Sprachtools kennt (Wörter teilweise abgehackt, komische Betonung). Mir wäre es die Ressourcen nicht wert.
Mich würde noch ein Test mit Mikrofonen interessieren, die wirklich mies sind. So auf dem Niveau von Bluetooth Kopfhörern / AirPods. Das getestete Ansteckmikrofon ist ja schon deutlich besser.