Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden.
Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
Test Nvidia Broadcast 2.0 im Test: Die neue KI-Studio-Sprachaufnahme ausprobiert
- Ersteller Vitche
- Erstellt am
- Zum Test: Nvidia Broadcast 2.0 im Test: Die neue KI-Studio-Sprachaufnahme ausprobiert
- Registriert
- Feb. 2019
- Beiträge
- 6.090
Hört sich definitiv stark anders an. Die Frage ist auch wie gut der Raum ist, richtige Störgeräusche hat man ja auch ohne KI nicht gehört.
Was mich da eher stört, man hat überhaupt keine Einstellungen und man muss später mit dem Ergebnis leben. Heißt eigentlich, wäre es ja viel besser die Original-Aufnahme einfach später zu bearbeiten.
Dann kann man auch die ganzen Effekte / KI-Effekte noch anwenden, aber eben gezielt. Adobe hat auch einen KI-Sprachverbesserer, aber da kann man alles möglich einstellen und z.B. auch die Unterstützung von 1-10. Heißt bei 8 geht es eher in Roboterhafte, Stufe 4 kann aber ein Improvement bringen, wo die eigene Stimme nicht verschwindet.
-> Anwendungszweck? Eigentlich dadurch "LIVE-Sachen", aber gerade da sagt ja Nvidia, dass man nicht viel Last haben darf, also z.B. keine Spiele. Wenn man aber etwas für später aufnimmt, dann kann man auch später nachbearbeiten und den Effekt drauflegen. Übrigens dann auch mit jeder Hardware, weil es einfach etwas länger dauern kann.
Was mich da eher stört, man hat überhaupt keine Einstellungen und man muss später mit dem Ergebnis leben. Heißt eigentlich, wäre es ja viel besser die Original-Aufnahme einfach später zu bearbeiten.
Dann kann man auch die ganzen Effekte / KI-Effekte noch anwenden, aber eben gezielt. Adobe hat auch einen KI-Sprachverbesserer, aber da kann man alles möglich einstellen und z.B. auch die Unterstützung von 1-10. Heißt bei 8 geht es eher in Roboterhafte, Stufe 4 kann aber ein Improvement bringen, wo die eigene Stimme nicht verschwindet.
-> Anwendungszweck? Eigentlich dadurch "LIVE-Sachen", aber gerade da sagt ja Nvidia, dass man nicht viel Last haben darf, also z.B. keine Spiele. Wenn man aber etwas für später aufnimmt, dann kann man auch später nachbearbeiten und den Effekt drauflegen. Übrigens dann auch mit jeder Hardware, weil es einfach etwas länger dauern kann.
Audiotests sollten immer blind stattfinden, da man hier schon vorab eine Meinung hat, insbesondere, wenn der Text dazu die Meinung schon impliziert und eine Marke im Spiel ist.
Ich finde das Ergebnis durchwachsen, denke aber dass das Feature eben nicht dafür da ist quasi Studio-Qualität in Studio-Qualität™ zu wandeln. Eure Quellen, egal welche Stimme oder welches Mikrofon, sind ja dennoch schon sehr hochwertig, ich kenne da aus meinen Teams-Sitzungen und Discord-Sessions ganz anderes.
Es wäre für mich definitiv kein Kaufgrund, da würde ich das Geld eher in eine sehr gute Aufnahmeausstattung stecken, wenn das mein Feld wäre. Für den normalen Chat tut das Broadcast Noise Removal noch immer einen guten Job, knirschende Kartoffelchips, die mechanische Tastatur oder die Mikroschalter der Maus sind damit erst mal aus jedem Chat verbannt.
Schöne wäre, wenn NVIDIA Broadcast ein Modul für eigene VST Plugins einbinden würde, da wäre mehr möglich![Lächeln :) :)](/forum/styles/smilies/smile.gif)
Eventuell solltet ihr das noch mal unter richtig schlechten Bedingungen testen, offenes Fenster mit Verkehrslärm, Vogelgezwitscher und spielende Kinder im Park oder so und schauen ob dann immer noch diese seichte KI faltenfrei gebügelte "Studio" Konserve bei rauskommt.
Danke für den Test.
Ich finde das Ergebnis durchwachsen, denke aber dass das Feature eben nicht dafür da ist quasi Studio-Qualität in Studio-Qualität™ zu wandeln. Eure Quellen, egal welche Stimme oder welches Mikrofon, sind ja dennoch schon sehr hochwertig, ich kenne da aus meinen Teams-Sitzungen und Discord-Sessions ganz anderes.
Es wäre für mich definitiv kein Kaufgrund, da würde ich das Geld eher in eine sehr gute Aufnahmeausstattung stecken, wenn das mein Feld wäre. Für den normalen Chat tut das Broadcast Noise Removal noch immer einen guten Job, knirschende Kartoffelchips, die mechanische Tastatur oder die Mikroschalter der Maus sind damit erst mal aus jedem Chat verbannt.
Schöne wäre, wenn NVIDIA Broadcast ein Modul für eigene VST Plugins einbinden würde, da wäre mehr möglich
![Lächeln :) :)](/forum/styles/smilies/smile.gif)
Eventuell solltet ihr das noch mal unter richtig schlechten Bedingungen testen, offenes Fenster mit Verkehrslärm, Vogelgezwitscher und spielende Kinder im Park oder so und schauen ob dann immer noch diese seichte KI faltenfrei gebügelte "Studio" Konserve bei rauskommt.
Danke für den Test.
Klingt ähnlich wie das enhanced Speech von Adobe. Zur Restauration wirklich ekelhafter Audio-Files kann man das schon mal mit reinmischen, aber so solo und live, wie es hier verwendet wurde imho völlig unbrauchbar. Man hört die KI und den Müll, den sie teilweise anstellt einfach alle paar Sekunden raus. Damit das brauchbar sein kann, brauchts mehr Einstellungsmöglichkeiten. Dann ist es aber auch nur zu empfehlen, wenn man den Nachhall im Raum nicht in den Griff bekommen darf/will und Geld für nen 50€ USB-Mikrofon fehlt, welches natürlich auch von "High-End Studio" meilenweit entfernt ist, aber trotzdem besser als die KI-Hilfe. Im Test mit dem Rode wäre ersteres (der Raum) das Problem (Klingt als wäre er nen halben Meter weit weg, aber wahrscheinlich ist einfach der Raum zu kahl).
- Registriert
- Sep. 2009
- Beiträge
- 2.084
bei der nativen Aufnahme sind viel mehr "Schmatz"(?)-Geräusche als sonst im Podcast enthalten.
Werden die normalerweise von Broadcast 1.x gefiltert?
Die Stimme + Broadcast 2.0 in hört sich "professioneller" an, ich kann aber nicht einschätzen, ob die merkwürdige "Melodie" gegen Ende vom Sprecher kommt oder von der AI erfunden wurde.
Hilfreich zum vergleichen wäre es gewesen, die gleiche Aufnahme zeitgleich mit 2 Mikrophonen zu machen, oder die native Aufnahme postum durch Nvidia Studio zu schicken, damit man den Output zweier identischer Inputs vergleichen kann.
Werden die normalerweise von Broadcast 1.x gefiltert?
Die Stimme + Broadcast 2.0 in hört sich "professioneller" an, ich kann aber nicht einschätzen, ob die merkwürdige "Melodie" gegen Ende vom Sprecher kommt oder von der AI erfunden wurde.
Hilfreich zum vergleichen wäre es gewesen, die gleiche Aufnahme zeitgleich mit 2 Mikrophonen zu machen, oder die native Aufnahme postum durch Nvidia Studio zu schicken, damit man den Output zweier identischer Inputs vergleichen kann.
- Registriert
- Okt. 2023
- Beiträge
- 2.533
Hört sich knödelig an. Da gibt es noch viel Bedarf an Verbesserungen.
Nichts geht über Doppel-Blindtests.Arboster schrieb:Das wäre doch etwas für einen Blindtest.
![Zwinkern ;) ;)](/forum/styles/smilies/wink.gif)
TøxicGhøst
Lieutenant
- Registriert
- Mai 2020
- Beiträge
- 926
Hört sich mit meinem Audio Technica AT2035 an einem Volt 1 Interface absolut scheiße an.
Bei der günstigen Aufnahmetechnik finde ich es besser. Bei den anderen lohnt es sich nicht wirklich. Es ist zwar anders aber nicht unbedingt besser. Die sind aber auch schon gut.
Mich würde eher interessieren wie es sich anhört wenn es Störgeräusche gibt, z.B:
Mich würde eher interessieren wie es sich anhört wenn es Störgeräusche gibt, z.B:
- TV im Hintergrund
- Staubsauger nebenann
- Baustelle draußen
- Ventilator auf dem Tisch
- Tippgeräusche (nebenbei Text auf Tastatur schreiben)
- Stuhl knarrt und quietscht wenn sich der Sprecher bewegt
Stefan1200
Lt. Junior Grade
- Registriert
- Mai 2018
- Beiträge
- 480
Das meiner Meinung nach einzige brauchbare neue Feature in Broadcast 2.0 ist die neue künstliche Belichtung der Webcam. Aber nur dieser eine Effekt benötigt auf meiner RTX 4070 Ti knapp 300 Watt zusätzlich zu den beiden anderen Effekten (ich nutze Broadcast für die Webcam schon seit Jahren, bisher halt nur die "Auto Zoom" und "Hintergrund ersetzen" Funktion). Da verzichte ich doch lieber ![Breites Grinsen :D :D](/forum/styles/smilies/biggrin.gif)
![Breites Grinsen :D :D](/forum/styles/smilies/biggrin.gif)
Salamimander
Commodore
- Registriert
- Okt. 2019
- Beiträge
- 4.273
Das beste an dem Artikel ist der Hinweis auf das 44€ Mikro. Endlich habe ich mal ein vernünftiges Zuhause, danke ![Breites Grinsen :D :D](/forum/styles/smilies/biggrin.gif)
![Breites Grinsen :D :D](/forum/styles/smilies/biggrin.gif)
fox40phil
Rear Admiral
- Registriert
- Okt. 2008
- Beiträge
- 6.015
Mit dem Rode + Ki klang es etwas nuschelnd :/…
Bei dem Hardware Hunger, dem Resultat und Leistungsaufnahme empfinde ich das Feature als sehr schlecht gelöst… also ich habe bei so einer vermeintlich „simplen“ Sache erst mal mit deutlich besser Performance (W) gerechnet!
Bei dem Hardware Hunger, dem Resultat und Leistungsaufnahme empfinde ich das Feature als sehr schlecht gelöst… also ich habe bei so einer vermeintlich „simplen“ Sache erst mal mit deutlich besser Performance (W) gerechnet!
- Registriert
- Juli 2024
- Beiträge
- 436
knödelig ist das Wort, nach dem man immer verzweifelt sucht. Danke!Quidproquo77 schrieb:Hört sich knödelig an.
- Registriert
- Feb. 2008
- Beiträge
- 1.343
Mein Tipp wäre:Sweepi schrieb:bei der nativen Aufnahme sind viel mehr "Schmatz"(?)-Geräusche als sonst im Podcast enthalten.
Werden die normalerweise von Broadcast 1.x gefiltert?
Kaffee.
Also ganz ohne Witz.
Es wird vor Vorträgen, Podcasts und ähnlichem davon abgeraten, Kaffee zu trinken, da der Schmatzgeräusche begünstigt. Was hier für nen kurzen Test vermutlich ziemlich irrelevant war/ist.
![Breites Grinsen :D :D](/forum/styles/smilies/biggrin.gif)
This.S.Kara schrieb:Mich würde eher interessieren wie es sich anhört wenn es Störgeräusche gibt, z.B:
- TV im Hintergrund
- Staubsauger nebenann
- Baustelle draußen
- Ventilator auf dem Tisch
- Tippgeräusche (nebenbei Text auf Tastatur schreiben)
- Stuhl knarrt und quietscht wenn sich der Sprecher bewegt
@Vitche ich würde auch vermuten, dass eure Umgebung zu clean war und man deshalb - so finde ich - in allen drei Varianten eine sehr gute Sprachverständlichkeit in der Rohfassung hat. Insofern bietet das Nvidia KI-Gedöns hier keinen Mehrwert, die Sprache hört sich einfach nur anders an.
Spannend wird's, wenn die Distanz zwischen Sprecher und Mikrofon (zu) groß wird, ergo der SNR immer schlechter durch ganz natürlichen Raumhall oder eben bedingt durch äußere Störeinflüsse wie oben von @S.Kara geschildert.
Vielleicht sogar noch ergänzt durch schwierigere Faktoren wie spielende Kinder oder gar andere Personen im gleichen Raum, die auch sprechen.
Ich mische Dialog für Synchron/TV/Film/Spiele. Hier ein kleiner Versuch was auf die Schnelle jemand vom Fach hiermit machen würde.
Audio Anhang ist Opus 64kbit/Kanal - 201 kByte und geht aus dem Beispiel des günstigen Ansteckmikrofons hervor. Es wurde versucht es in etwa gleich laut wie das Original zu gestalten um einen guten Vergleich herstellen zu können.
Ich finde dieses NVidia Broadcast 2 ist ein Fortschritt aber noch nicht ausgereift. Besser als es nicht zu haben mit kleinen Schönheitsfehlern, und wenn ich ehrlich sein soll auch etwas anspruchsvoll was die Resourcen angeht.
Meine Methode ist auch nicht ganz ohne. Allerdings schluckt das ganze etwa 35% eines 5950X CPU Kerns, was wohl etwas effizienter ist.
Ich bin gespannt auf die nächste Version, denn schlechter wird es meistens nicht.
Audio Anhang ist Opus 64kbit/Kanal - 201 kByte und geht aus dem Beispiel des günstigen Ansteckmikrofons hervor. Es wurde versucht es in etwa gleich laut wie das Original zu gestalten um einen guten Vergleich herstellen zu können.
Ich finde dieses NVidia Broadcast 2 ist ein Fortschritt aber noch nicht ausgereift. Besser als es nicht zu haben mit kleinen Schönheitsfehlern, und wenn ich ehrlich sein soll auch etwas anspruchsvoll was die Resourcen angeht.
Meine Methode ist auch nicht ganz ohne. Allerdings schluckt das ganze etwa 35% eines 5950X CPU Kerns, was wohl etwas effizienter ist.
Ich bin gespannt auf die nächste Version, denn schlechter wird es meistens nicht.
Anhänge
Zuletzt bearbeitet:
Ähnliche Themen
- Antworten
- 115
- Aufrufe
- 6.188