Test Nvidia Broadcast 2.0 im Test: Die neue KI-Studio-Sprachaufnahme ausprobiert

Vitche

Redakteur Pro
Teammitglied
Registriert
Aug. 2016
Beiträge
3.684
Parallel zu RTX 50 und neuen Grafiktreibern ist Nvidia Broadcast in Version 2.0 erschienen. Mit von der Partie ist das Beta-Feature Studio-Sprachaufnahme, mit dem Nutzer die Qualität ihres Mikrofons auf das Niveau eines High-End-Tonstudios anheben können sollen. ComputerBase hat die neue Funktion ausprobiert.

Zum Test: Nvidia Broadcast 2.0 im Test: Die neue KI-Studio-Sprachaufnahme ausprobiert
 
  • Gefällt mir
Reaktionen: Trinoo, BrollyLSSJ, DeusoftheWired und 2 andere
Also rein von der Verständlichkeit finde ich die native Aufnahme besser, und zwar deutlich.
Die "Studio" Version klingt, als wären teilweise am Ende eines gesprochenen Wortes ein paar zentel(milli?)Sekunden abgeschnitten.
Ist schwierig zu beschreiben, aber der nativen Aufnahme kann ich viel leichter folgen.

@Vitche Das wäre doch etwas für einen Blindtest.
 
  • Gefällt mir
Reaktionen: Drahminedum, fox40phil, Weyoun und 7 andere
Also ich finde das eher unangenehm und zu künstlich. Beim Broadcast könnt ihr dann auch einfach nur noch TextToSpeech an machen, will dann keiner mehr hören. Am Ende ists dann eh AI Fake.

Wer sich so eine GPU leistet und dann mit Müllmic kommt ist sowieso Fail.
 
  • Gefällt mir
Reaktionen: the_IT_Guy und BacShea
NAJA. Wer Wert auf ne ordentliche Aufnahme legt, sollte dann doch ein paar mehr Euro in die Hand nehmen und sich ein ordentliches Mikro kaufen.
 
  • Gefällt mir
Reaktionen: nco2k, Sceve, thornhill und 6 andere
Irgendwie klingen die Studio-Aufnahmen einfach nur danach, als wären sie durch eine großzügige Rauschunterdrückung gegangen...
Dass man dafür "KI-Funktionen" nutzen "muss" ist also wohl eher Marketing als irgendwas anderes...
 
Meiner Meinung nach hört sich das gar nicht besser an, nur anders.
Punkt.
Aufnahmen die dies belegen, gab es schon hier.

NVIDIA Sinnlosfeature 2.0

Die Marketingabteilung war letztens von Berlin bis Prag unterwegs?
"Die gezielte Einnahme von Drogen unbekannter Herkunft, das ist wichtig"
Udo Lindenberg

Ja, gezielt. Nicht darüber hinaus!

Gruß Fred.
 
  • Gefällt mir
Reaktionen: Der_Dicke82
Tatsächlich fand ich persönlich alle Aufnahmen ohne das Feature irgendwie angenehmer weil klarer!
Wobei ich mir vorstellen kann, das die Aufnahme mit dem Feature tatsächlich auf Dauer angenehmer sein könnte! Im vergleich hört es sich dumpfer an, aber auch irgendwie professioneller! Eher nach Hörbuch
 
  • Gefällt mir
Reaktionen: fox40phil, the_IT_Guy und Quindan
Mich interessiert das Thema nicht so wirklich, ich wollte aber mal das Thumbnail des Artikels lobend erwähnen: Es hat mir ein Schmunzeln ins Gesicht gezaubert :)
 
  • Gefällt mir
Reaktionen: Vitche und MalWiederIch
Interessant wäre ein Vergleich, wenn integrierte Mikrofone genutzt werden. Laptopmikros, Webcammikros, Handymikros, ...
Vielleicht werden die wirklich schlechten Aufnahmen wesentlich besser.
 
  • Gefällt mir
Reaktionen: fox40phil, Geckoo, CMDCake und 5 andere
Ein Profi lädt sich die nötigen VST Plugins und klingt auch nach einer seriösen Radiostation ohne eine GPU Standheizung.

Dann lallt und klingt die Stimme auch nicht hart. Auf einem K702 klingen die Aufnahmen vom Broadcaststudio 2.0 ziemlich unsauber.

"nvidia Brotkasst", das geht Richtung Dialekt. Ich wäre für Radiosender Käptn Blaubär.:D
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: fox40phil, Apocalypse und Abrexxes
bei meiner Creative-Soundkarte kann ich einstellen, dass meine Stimme wie ein "Elf" oder ein "Ork" klingen soll. Ganz ohne KI und 300W Leistungsaufnahme.
Klingt halt auch nicht besser, nur anders. 🤷‍♂️ /S


PS: finde diese Technik von NV prinzipiell gut, aber beim derzeitigen Stand von Leistungsaufnahme und Ergebnis ist es Spielerei, nix anderes.
 
  • Gefällt mir
Reaktionen: fox40phil und FR3DI
Hmm in meinen Ohren klingen alle Aufnahmen nativ besser.

Aber das beste an dem Test hier ist: Niemand hat Josef K. verleumdet, offensichtlich hat er nichts böses getan!
 
  • Gefällt mir
Reaktionen: CMDCake
MasterWinne schrieb:
Also ich finde das eher unangenehm und zu künstlich. Beim Broadcast könnt ihr dann auch einfach nur noch TextToSpeech an machen, will dann keiner mehr hören. Am Ende ists dann eh AI Fake.

Wer sich so eine GPU leistet und dann mit Müllmic kommt ist sowieso Fail.
Oh, es gibt da mittlerweile ein paar AI-Stimmen die so bekannt und beliebt sind ... da hat man dann tatsächlich AI-Studio-Qualität ;-)

Anders als mit dem Mist hier, der nur sinnlos die Luft warm macht.
 
Krass welche Anforderungen das hat. Ein Audioprogramm und 2-3 VST brauchen auf aktuellen Systemen vielleicht 3-4 % leistung des Rechners. Völliger Witz was Nvidia da abliefert. Bananensoftware.
 
Funktioniert denn die Rauschunterdrückung?

Ist ja wichtig, um das Rauschen der hochdrehenden Lüfter rauszufiltern.
 
Mich überzeugt das ehrlich gesagt gar nicht. Zum Einen hört es sich im ersten Beispiel so an, als würde eine ganz andere Person sprechen und zum Anderen kann man "Artefakte" hören, die man von bisherigen AI Sprachtools kennt (Wörter teilweise abgehackt, komische Betonung). Mir wäre es die Ressourcen nicht wert.

Mich würde noch ein Test mit Mikrofonen interessieren, die wirklich mies sind. So auf dem Niveau von Bluetooth Kopfhörern / AirPods. Das getestete Ansteckmikrofon ist ja schon deutlich besser.
 
Rode NT-USB fand ich war es vor allem einfach anders.

Bei den günstigeren war es dann schon besser - besonders Raumhall wurde gut rausgenommen.
 
  • Gefällt mir
Reaktionen: Ataki
Zurück
Oben