Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden.
Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
Test Nvidia Broadcast 2.0 im Test: Die neue KI-Studio-Sprachaufnahme ausprobiert
- Ersteller Vitche
- Erstellt am
- Zum Test: Nvidia Broadcast 2.0 im Test: Die neue KI-Studio-Sprachaufnahme ausprobiert
Empfinde ich genauso, bin sehr verwundert über den Konsens in den Kommentaren.aLanaMiau schrieb:Find die Broadcast Aufnahmen klingen deutlich besser und professioneller.
Ja, es ist nicht perfekt. Aber es klingt definitiv deutlich näher nach "Studio" als ohne. Nativ klingts halt wie in der Küche aufgenommen.
CadillacFan77
Lt. Commander
- Registriert
- Feb. 2005
- Beiträge
- 1.073
Also das überzeugt mich jetzt eher weniger.
Die Rauschunterdrückung hat trotz der sehr ruhigen Umgebung (gemäss den nativen Aufnahmen) nicht wirklich gut funktioniert und scheint selbst so für ziemliche Artefakte zu sorgen. Gerade die Enden der Worte sind abgehackt und nicht klar.
Raumhall kann man schlecht beurteilen, da man auch auf den nativen Aufnahmen kaum Raumhall vernommen hatte.
Betreffend Leistungsbedarf ist das ein Witz. Ich bin beruflich im Bereich Audio/Video Kommunikation unterwegs und da sind die Technologien absolute Notwendigkeit und weit verbreitet. Erreicht werden wirklich krasse Ergebnisse (Beispiel 1, Beispiel 2, Beispiel 3) und die Hardware dazu läuft auf irgendwelchen ARM CPUs und das ganze Ding läuft mit 20W Gesamtleistungsaufnahme inkl. Video Übertragung, Auto-Framing, Content Sharing usw.
Die Rauschunterdrückung hat trotz der sehr ruhigen Umgebung (gemäss den nativen Aufnahmen) nicht wirklich gut funktioniert und scheint selbst so für ziemliche Artefakte zu sorgen. Gerade die Enden der Worte sind abgehackt und nicht klar.
Raumhall kann man schlecht beurteilen, da man auch auf den nativen Aufnahmen kaum Raumhall vernommen hatte.
Betreffend Leistungsbedarf ist das ein Witz. Ich bin beruflich im Bereich Audio/Video Kommunikation unterwegs und da sind die Technologien absolute Notwendigkeit und weit verbreitet. Erreicht werden wirklich krasse Ergebnisse (Beispiel 1, Beispiel 2, Beispiel 3) und die Hardware dazu läuft auf irgendwelchen ARM CPUs und das ganze Ding läuft mit 20W Gesamtleistungsaufnahme inkl. Video Übertragung, Auto-Framing, Content Sharing usw.
Artikel-Update: Der Artikel wurde auf Wunsch einiger Leser um einen Abschnitt zum Ergebnis der Studio-Sprachaufnahme bei einer von massiven Störgeräuschen befallenen nativen Aufnahme ergänzt, die das KI-Modell merklich an seine Grenzen bringt.
Shririnovski
Captain Pro
- Registriert
- Sep. 2012
- Beiträge
- 3.175
Ich bin nicht besonders beeindruckt. Es klingt mit AI anders als ohne, aber wirklich verständlicher wird es für mich nicht. Ob es "besser" klingt, will ich da garnicht beurteilen, jeder hört nunmal ein wenig anders.
Ich würde darauf jedenfalls verzichten, ein brauchbares Mikro plus einigermaßen saubere Einstellung und der Klang ist auch ohne AI OK.
Ich würde darauf jedenfalls verzichten, ein brauchbares Mikro plus einigermaßen saubere Einstellung und der Klang ist auch ohne AI OK.
- Registriert
- Juli 2024
- Beiträge
- 406
Mit Störgeräuschen besser verstanden als ohne durch AI. Das ist irgendwie alles falsch. Ich warte auf News ohne Nvidia, damit ich wieder Spaß am lesen hab. Aber momentan ist ja jede News mit RTX irgendwie. Jetzt würde ich mich über Huawei News sogar freuen.
St3ppenWoLF
Commander
- Registriert
- Sep. 2013
- Beiträge
- 2.941
Dann lieber richtiges Aufnahmeequipment beschaffen, ist vermutlich sinnvoller. Aber ich schreibe hier nur als Laie 😅 (und lasse mich gerne verbessern 😎👍)
crustenscharbap
Commodore
- Registriert
- Jan. 2008
- Beiträge
- 5.059
Man braucht ja so ein Feature weil die 600W Grafikkarten zu laut sind. 🤭
Spaß beiseite. Ich finde es kaum besser da die Mikrofone ja sowieso schon gut klangen. Ich hätte mal gerne gehört wie das mit Bluetooth Mikros klingt. Die können ja nicht mehr als 11Khz und klingen alle bescheiden. Könnt ihr das bitte testen?
Bei der Tonspur mit extremen Hintergrundgeräuchen bin ich doch überrascht wie die KI das Rauschen weg bekommt. Aber auch enttäuscht, da der irgendwie englische Laute rein packt. Da verstehe ich weniger als mit Rauschen. Dauert wieder drölf Jahre bis das auf Deutsch geht.
Wäre interessant Windrauschen weg zu rechnen.
Spaß beiseite. Ich finde es kaum besser da die Mikrofone ja sowieso schon gut klangen. Ich hätte mal gerne gehört wie das mit Bluetooth Mikros klingt. Die können ja nicht mehr als 11Khz und klingen alle bescheiden. Könnt ihr das bitte testen?
Bei der Tonspur mit extremen Hintergrundgeräuchen bin ich doch überrascht wie die KI das Rauschen weg bekommt. Aber auch enttäuscht, da der irgendwie englische Laute rein packt. Da verstehe ich weniger als mit Rauschen. Dauert wieder drölf Jahre bis das auf Deutsch geht.
Wäre interessant Windrauschen weg zu rechnen.
Trimipramin
Commodore
- Registriert
- Sep. 2014
- Beiträge
- 4.838
Danke für das Update. Da hört man nun tatsächlich einen Unterschied.
Beeindruckend wie die ganzen Störgeräusche entfernt werden, aber irgendwie ist das für mich eine Verschlimmbesserung. Kann den Text im Originalen besser verstehen.
Falls ihr Langeweile habt gerne noch mit "normalen" Störgeräuschen testen. Also Mikro nah am Sprecher.
Beeindruckend wie die ganzen Störgeräusche entfernt werden, aber irgendwie ist das für mich eine Verschlimmbesserung. Kann den Text im Originalen besser verstehen.
Falls ihr Langeweile habt gerne noch mit "normalen" Störgeräuschen testen. Also Mikro nah am Sprecher.
Die ist ein Custom-Frankenstein, aber das Case ist tatsächlich einfach das einer Ducky One 3 Mini. Taster weiß ich gerade gar nicht, glaube Boba U4T lubed, Keycaps sind GMK Bento.Trimipramin schrieb:@Vitche Sry für OT: was isch des für ne Tastatur? o:
Tenferenzu
Vice Admiral Pro
- Registriert
- Okt. 2017
- Beiträge
- 6.553
Für mich hören sich die Aufnahmen so an als ob das Gate viel zu spät öffnet und viel zu früh schließt. Das in Kombination mit einem viel zu aggresiven Kompressor und man kommt auch ungefähr dorthin wo man hier ist.
Einzig die Entfernung der Nebengeräusche werte ich hier mal als positiv.
Einzig die Entfernung der Nebengeräusche werte ich hier mal als positiv.
Salamimander
Commodore
- Registriert
- Okt. 2019
- Beiträge
- 4.264
Für “Schalter ein” holt NVIDIA aber viel aus der tonspur raus. Die Frage ist ja auch, welche Sprachen trainiert wurden
Bin wohl eine der wenigen die tatsächlich dieses künstliche Studio Audio besser, es hört sich einfach cleaner und sauber. Ist halt meine Empfindung.
Aber dat Ding braucht echt viel Grafikleistung, also in dieser Hinsicht muss sich was tun, mein 4090 ist bei 30% Auslastung wenn ich es aktiviere , echt Crazy.
Aber dat Ding braucht echt viel Grafikleistung, also in dieser Hinsicht muss sich was tun, mein 4090 ist bei 30% Auslastung wenn ich es aktiviere , echt Crazy.
Ähnliche Themen
- Antworten
- 113
- Aufrufe
- 5.919