Test Nvidia Broadcast 2.0 im Test: Die neue KI-Studio-Sprachaufnahme ausprobiert

Vitche · 3. Februar 2025

Parallel zu RTX 50 und neuen Grafiktreibern ist Nvidia Broadcast in Version 2.0 erschienen. Mit von der Partie ist das Beta-Feature Studio-Sprachaufnahme, mit dem Nutzer die Qualität ihres Mikrofons auf das Niveau eines High-End-Tonstudios anheben können sollen. ComputerBase hat die neue Funktion ausprobiert.

Zum Test: Nvidia Broadcast 2.0 im Test: Die neue KI-Studio-Sprachaufnahme ausprobiert

Arboster · 3. Februar 2025

Also rein von der Verständlichkeit finde ich die native Aufnahme besser, und zwar deutlich.
Die "Studio" Version klingt, als wären teilweise am Ende eines gesprochenen Wortes ein paar zentel(milli?)Sekunden abgeschnitten.
Ist schwierig zu beschreiben, aber der nativen Aufnahme kann ich viel leichter folgen.

@Vitche Das wäre doch etwas für einen Blindtest.

MasterWinne · 3. Februar 2025

Also ich finde das eher unangenehm und zu künstlich. Beim Broadcast könnt ihr dann auch einfach nur noch TextToSpeech an machen, will dann keiner mehr hören. Am Ende ists dann eh AI Fake.

Wer sich so eine GPU leistet und dann mit Müllmic kommt ist sowieso Fail.

Azeron · 3. Februar 2025

NAJA. Wer Wert auf ne ordentliche Aufnahme legt, sollte dann doch ein paar mehr Euro in die Hand nehmen und sich ein ordentliches Mikro kaufen.

Termy · 3. Februar 2025

Irgendwie klingen die Studio-Aufnahmen einfach nur danach, als wären sie durch eine großzügige Rauschunterdrückung gegangen...
Dass man dafür "KI-Funktionen" nutzen "muss" ist also wohl eher Marketing als irgendwas anderes...

FR3DI · 3. Februar 2025

Meiner Meinung nach hört sich das gar nicht besser an, nur anders.

Punkt.
Aufnahmen die dies belegen, gab es schon hier.

NVIDIA Sinnlosfeature 2.0

Die Marketingabteilung war letztens von Berlin bis Prag unterwegs?

"Die gezielte Einnahme von Drogen unbekannter Herkunft, das ist wichtig"

Udo Lindenberg

Ja, gezielt. Nicht darüber hinaus!

Gruß Fred.

Der_Dicke82 · 3. Februar 2025

Tatsächlich fand ich persönlich alle Aufnahmen ohne das Feature irgendwie angenehmer weil klarer!
Wobei ich mir vorstellen kann, das die Aufnahme mit dem Feature tatsächlich auf Dauer angenehmer sein könnte! Im vergleich hört es sich dumpfer an, aber auch irgendwie professioneller! Eher nach Hörbuch

lolinternet · 3. Februar 2025

Nativ deutlich besser. Schuster bleib bei deinen Leisten.

Numerfolt · 3. Februar 2025

Mich interessiert das Thema nicht so wirklich, ich wollte aber mal das Thumbnail des Artikels lobend erwähnen: Es hat mir ein Schmunzeln ins Gesicht gezaubert

controlokk · 3. Februar 2025

Imm er mehr Gründe 5x00er liegen zu lassen

Augen1337 · 3. Februar 2025

Interessant wäre ein Vergleich, wenn integrierte Mikrofone genutzt werden. Laptopmikros, Webcammikros, Handymikros, ...
Vielleicht werden die wirklich schlechten Aufnahmen wesentlich besser.

Der Nachbar · 3. Februar 2025

Ein Profi lädt sich die nötigen VST Plugins und klingt auch nach einer seriösen Radiostation ohne eine GPU Standheizung.

Dann lallt und klingt die Stimme auch nicht hart. Auf einem K702 klingen die Aufnahmen vom Broadcaststudio 2.0 ziemlich unsauber.

"nvidia Brotkasst", das geht Richtung Dialekt. Ich wäre für Radiosender Käptn Blaubär.

aid0nex · 3. Februar 2025

Vermutlich ist es bei den aktuellen Preisen für RTX 5080 und 5090 immer noch billiger sich einfach ein professionelles Tonstudio zu bauen.

n8mahr · 3. Februar 2025

bei meiner Creative-Soundkarte kann ich einstellen, dass meine Stimme wie ein "Elf" oder ein "Ork" klingen soll. Ganz ohne KI und 300W Leistungsaufnahme.
Klingt halt auch nicht besser, nur anders. 🤷‍♂️ /S

PS: finde diese Technik von NV prinzipiell gut, aber beim derzeitigen Stand von Leistungsaufnahme und Ergebnis ist es Spielerei, nix anderes.

TheBeastMaster · 3. Februar 2025

Hmm in meinen Ohren klingen alle Aufnahmen nativ besser.

Aber das beste an dem Test hier ist: Niemand hat Josef K. verleumdet, offensichtlich hat er nichts böses getan!

Apocalypse · 3. Februar 2025

MasterWinne schrieb:
Also ich finde das eher unangenehm und zu künstlich. Beim Broadcast könnt ihr dann auch einfach nur noch TextToSpeech an machen, will dann keiner mehr hören. Am Ende ists dann eh AI Fake.

Wer sich so eine GPU leistet und dann mit Müllmic kommt ist sowieso Fail.

Oh, es gibt da mittlerweile ein paar AI-Stimmen die so bekannt und beliebt sind ... da hat man dann tatsächlich AI-Studio-Qualität ;-)

Anders als mit dem Mist hier, der nur sinnlos die Luft warm macht.

Fraggil · 3. Februar 2025

Krass welche Anforderungen das hat. Ein Audioprogramm und 2-3 VST brauchen auf aktuellen Systemen vielleicht 3-4 % leistung des Rechners. Völliger Witz was Nvidia da abliefert. Bananensoftware.

MichaW · 3. Februar 2025

Funktioniert denn die Rauschunterdrückung?

Ist ja wichtig, um das Rauschen der hochdrehenden Lüfter rauszufiltern.

Slowz · 3. Februar 2025

Mich überzeugt das ehrlich gesagt gar nicht. Zum Einen hört es sich im ersten Beispiel so an, als würde eine ganz andere Person sprechen und zum Anderen kann man "Artefakte" hören, die man von bisherigen AI Sprachtools kennt (Wörter teilweise abgehackt, komische Betonung). Mir wäre es die Ressourcen nicht wert.

Mich würde noch ein Test mit Mikrofonen interessieren, die wirklich mies sind. So auf dem Niveau von Bluetooth Kopfhörern / AirPods. Das getestete Ansteckmikrofon ist ja schon deutlich besser.

Autokiller677 · 3. Februar 2025

Rode NT-USB fand ich war es vor allem einfach anders.

Bei den günstigeren war es dann schon besser - besonders Raumhall wurde gut rausgenommen.

Test Nvidia Broadcast 2.0 im Test: Die neue KI-Studio-Sprachaufnahme ausprobiert

Redakteur Pro

Lt. Commander Pro

MasterWinne

Gast

Commander

Rear Admiral Pro

Banned

Lt. Commander

Ensign

Cadet 1st Year

Lieutenant

Captain Pro

Admiral

Captain Pro

Commodore

Lieutenant

Vice Admiral

Ensign

Lt. Commander

Lt. Commander

Fleet Admiral

Ähnliche Themen