News RTX Voice Beta: Nvidia filtert Geräusche per GPU und Deep Learning

Früher brauchte man keine KI dafür, man nannte es Dolby B und C. :p Mal ehrlich, dafür gibts heute zig andere gute Tools im Audiobereich, wer braucht da eine KI? Die bräuchten bei allen angegebenen Programmen nur mal eine einheitliche Schnittstelle wie VST3 unterstützen, und dann hat sich der Käse. Warum muß sich dafür jetzt die GPU über Tensorcores extra erwärmen?
 
PHuV schrieb:
dafür gibts heute zig andere gute Tools im Audiobereich, wer braucht da eine KI?

Also bisher kenne ich kein Tool mit dem ich zuverlässig verhindern kann das der Sound von mir beim reinpusten ins Micro geblockt wird. Das schafft die KI nämlich. Ich kann da reinpusten wie ich will, es wird nicht aufgenommen. Eine krasse Verzögerung konnte ich bisher beim testen ebenfalls nicht feststellen.

Ich muss bei Gelegenheit mal testen ob die Software auch die Störgeräusche meiner Onboard am Eingang die auftreten sobald ich Netzwerkaktivitäten habe behebt. :D
 
  • Gefällt mir
Reaktionen: KlaraElfer
OBS hat beispielsweise zig Audiofilter eingebaut.
 
PHuV schrieb:
Früher brauchte man keine KI dafür, man nannte es Dolby B und C. :p Mal ehrlich, dafür gibts heute zig andere gute Tools im Audiobereich, wer braucht da eine KI?

Hast du es schon getestet? Dolby C und B sind damit nicht vergleichbar.
Gefiltert wurde da nichts.
 
Zuletzt bearbeitet von einem Moderator:
PHuV schrieb:
OBS hat beispielsweise zig Audiofilter eingebaut.

Die KI von Nvidia ist an sich aber kein Filter im herkömmlichem Sinne sondern eine Software die erkennt wenn ein Sound durchgelassen werden kann oder nicht, die Filter in OBS filtern oft alles, die Nvidia Software setzt darauf das nur störende Geräusche gefiltert werden. D. H. in der Regel sollte deine Stimme kaum bis garnicht gefiltert werden. Deswegen hört sich noise canceling bei vielen Soundkarten auch so grottig an, weil alles gefiltert wird da der Treiber der Soundkarte nicht erkennen kann was ein Störgeräusch ist und was nicht.

KI ist aufjedenfall die Zukunft in praktisch allen Bereichen und eine großartige Entwicklung von Nvidia. Hoffe von AMD kommt da bald auch was, ansonsten zieht Nvidia in zahlreichen spielen demnächst an AMD vorbei wegen DLSS.
 
  • Gefällt mir
Reaktionen: guillome, DestroYa, panzercrak und eine weitere Person
Enurian schrieb:
Nette Idee für Discord & Co, aber der Einsatzort Homeoffice ist doch an den Haaren herbeigezogen. Eine Gaminggrafikkarte im Arbeitsgerät dürfte wohl die absolute Ausnahme sein.

So verkehrt finde ich das eigentlich nicht.

Zu Hause habe ich keinen langweiligen Office PC sondern einen mit dem ich ab und zu auch mal ein Spiel anschmeissen kann.
 
ist doch für Streamer auch super. oder allgemein in teamspeak oder im spiel im voicechat. oder skype
 
Zuletzt bearbeitet:
Enurian schrieb:
Nette Idee für Discord & Co, aber der Einsatzort Homeoffice ist doch an den Haaren herbeigezogen. Eine Gaminggrafikkarte im Arbeitsgerät dürfte wohl die absolute Ausnahme sein.

Ja, da stimme ich dir zu. Für Homeoffice ist das eher was für die Zukunft, aber wer weiß. Vielleicht funktioniert das ja auch mit dem Nachfolger der GT 1030.
 
Nozuka schrieb:
das neue "KRISP" in Discord funktioniert eigentlich ziemlich gut
Danke für den Tipp. Hatte immer das Problem dass Mikro etc. immer sehr schwer einzustellen war damit das Keyboard mit Voice Activation nicht zu hören war. Das ändert jetzt einiges.
 
  • Gefällt mir
Reaktionen: fox40phil
Ob sie zukünftig auch ihre Preise filtern können? Oo
 
  • Gefällt mir
Reaktionen: IgorGlock und fox40phil
Botcruscher schrieb:
Das "Mama gib mir mal die Buntstifte" meiner Kollegin bekommt die Software zu 100% nicht weg.
Wieso ist die Mutter deiner Kollegin in deinem Office?

Das ANC meiner AirPods bekommt den Satz übrigens 100% weg.
Ergänzung ()

PHuV schrieb:
Früher brauchte man keine KI dafür, man nannte es Dolby B und C. :p
Unsinn, Dolby hat niemals Geräusche herausgefiltert. Das war ein Dynamikkompressor, der ausschließlich das Bandrauschen verbessern konnte.
 
  • Gefällt mir
Reaktionen: c9hris
Wenn auch noch Coronazeit fällt, dann helfen bei der eingesetzten Notebook und Smartphonetechnik nicht mal Deep Learning Funktionen. Wenn die Leute nicht noch die überbeanspruchten telefonica Leitungen zum Verglühen bringen.

Man merkt erst jetzt was für Elektronikschrott oder auch nur schlechte Einstellungen und automatische Erkennung in der Softwareprogrammierung den Stand der Dititalentwicklung sind.

Ohne Planarkopfhörer wären die wichtigeren Wortfetzen einfach nicht verständlich und da gab es letzte Woche einen Fall der Privatwirtschaftkonforenz berühmter Ökonomen, wo zur harten Komprimierung auch noch schlecht eingestellte Sprachaktivierung bei einem Nutzer nur noch Buchstaben übertrug.
Altmaier Kokoloresschaltung.jpg

Die passende Mikrofon und Bildsensortechnik ist komplett durchentwickelt und ausreichend miniaturisiert, das solche Ausfälle mit Filtertechniken in mobilen Geräten überhaupt nicht mehr sein müssen und man selbst als Streamer auch Richtmikrofone nutzen kann.

Der Kauf teurer nvidia Hardware ist daher nicht nötig, wenn die passenden Eingabegeräte genutzt werden und notfalls holt man sich noch ein filterndes dbx System.
 
TeeKay schrieb:
Da selbst ein Airpod Geräuschunterdrückung betreiben kann, dürfte der Leistungsverlust auf einer RTX Grafikkarte unmerklich sein.

Die airpods haben aber auch nen dedicated chip dafür. die GPU ist dafür eigentlich nicht vorgesehen. Von daher würde es mich nicht wundern wenn das nicht ein wenig Leistung kosten würde.
 
danke für die Info; hab ich direkt ausprobiert. Uuuund direkt wieder deinstalliert. Im Eigentest mit dem Windows Sprachrecorder klingt es damit doch sehr blechern.
 
Willi-Fi schrieb:
In jeder Gruppe, seien es Bekannte oder Fremde, ist genau der Spieler, der Schnupfen und Husten hat, aber wo das Echo mitklingt und natürlich dessen und unser Ingamesound. Jede Aufforderung es zu verbessert führt zu nichts. Aber ob diese Software das Problem lösen kann? Menschen kann man nicht ändern.


Wenn man Menschen nicht ändern könnte, hätte das Wort Manipulation wohl keine Bedeutung.
Ergänzung ()

Conqi schrieb:
Da haben wir scheinbar verschiedene Versionen. Laute Tastaturen, Störgeräusche vom Handy, Mutti, die zum essen ruft, kommt meiner Erfahrung nach alles durch.

Beide Programme haben Regler für diese Einstellung. Sprachqualität ist auch definitiv nicht, womit sich Discord von TS absetzen will.
 
Hätte nicht gedacht das soviele noch störgeräusche haben, ist mir bei meinen mates schon lange nicht mehr aufgefallen, vlt. liegt es auch daran das alle pcie soundkarten und "gute" headsets nutzen. Es ist von nvidia zwar ein nettes Feature, aber hoffentlich bleibt es einfach nur ein Feature was man eben hat oder nicht hat, und nichts was in nvidias augen so elementar wichtig wird, das man damit die hohen preise oder noch höhere preise rechtfertigen könnte. Ist nett zu sehen was mit der GPU machbar ist, aber am ende zählt halt was auf dem Bildschirm ankommt.
 
Der Nachbar schrieb:
Der Kauf teurer nvidia Hardware ist daher nicht nötig ...
Das schlägt ja auch niemand vor, wie kommst du da drauf? Aber manchen Leute sollen sowas schon verbaut haben, dann wäre gegen einen Mehrwert durch fuchsige Software ja nichts einzuwenden. Die dilettantischen Übertragungen allerorts momentan sagen übrigens genau gar nichts über den 'Stand der digitalen Entwicklung' aus, sondern nur über die Unfähigkeit der Benutzer. Man muss sich nur gut gemachte Podcasts ansehen (nein, die von heise gehören nicht dazu, die bekommen nicht mal einheitliche Tonpegel ihrer Teilnehmer hin), dann weiß man, was geht.

Ich persönlich bin bezüglich solcher Technologien eher skeptisch, solange die eigentliche 'Welt des Tons' das nicht aufgreift. Ich will sagen, Mischer, Masterer, Benutzer von DAWs etc. wäre entzückt, wenn es Tools gäbe, wie sie Nvidia da verspricht. Zumindest die, und davon gibts jede Menge, die nicht in sehr teuren Studioräumen arbeiten. Einfach mal ein Störgeräusch aus einer wertvollen Aufnahme rausfiltern, ohne diese dabei zu beeinflussen, ist nach wie vor eine riesige Aufgabe, wenn nicht unmöglich!

P.S.: Wann lernen die Firmen eigentlich endlich, dass diese Buzzwords wie 'deep learning' mittlerweile eher das Gegenteil des Beabsichtigten erreichen? Wenn ich das lese, werde ich jedenfalls gleich doppelt skeptisch und denke sofort 'Bullshit!'. Quasi als Assoziation: 'deep learning = bullshit', oder 'KI = unfähig'. Vielleicht erreicht das die PR-Abteilungen auch irgendwann mal :rolleyes:
Ergänzung ()

m3rch3r schrieb:
Wenn man Menschen nicht ändern könnte, hätte das Wort Manipulation wohl keine Bedeutung.
Doch, nämlich die, welches es immer schon hat: Beeinflussung, nicht Änderung. Der Mensch ändert sich nicht gleich, nur weil er für 10 Minuten manipuliert (beeinflusst) wird. Es reicht, wenn er in diesen 10 Minuten z.B. irgendeinen Kauf tätigt :D.
 
Willi-Fi schrieb:
Aber ob diese Software das Problem lösen kann? Menschen kann man nicht ändern.
Ich habe immer sehr ungern Kopfhörer auf und höre alles über die Anlage. Ich wäre ja schon froh, wenn die Aufnahme schon mal den Pegel wegschneidet, den der PC selbst ausgibt, damit man Kopplung vermeidet. Dazu bedarf es doch sicherlich kein Deep Learning oder Cloud Rechenleistung. Hier braucht man doch "nur" den bekannten Output mit dem Input vergleichen und nach einem kleinen Zeitoffset, genauso wegschneiden.
Bei meiner Soundblaster Z war ein Stereo Tischmikrofon dabei, womit ja eigentlich sogar die Quelle der Aufnahme ermittelt werden könnte und man dann auch noch Störgeräusche von anderen Quellen identifizieren könnte.
Irgendwie passiert da viel zu wenig.
 
Powertrip schrieb:
Braucht wirklich nur knapp 1,2GB RAM...
Zwischen "brauchen" und "reservieren" und tatsächlich "belegen" existieren aber immer noch große Unterschiede.
Die Windows Speicherverwaltung ist relativ komplex. Anwendungen reservieren sich immer erst einmal recht großzügig Speicher, falls er vorhanden ist, damit sie im Befarfsfall keinen zusätzlichen allozieren müssen.
Dann ist es immer noch ein Unterschied ob der Speicher komplett privat oder geteilt mit anderen Anwendungen genutzt wird. Belegter Speicher wird zum großen Teil auch doppelt und dreifach gezählt, weil viele Bereiche von mehreren Anwendungen gleichzeitig genutzt werden. Je nachdem was du dir da anzeigen lässt enthält es auch in den Speicher gemappte Dateien. Das könnte hier zum Beispiel der Fall sein, wenn die Anwendung eine 1 GB große Cache-Datei oder so etwas auf der Platte öffnet. Das landet aber nicht im Arbeitsspeicher.
Es ist also immer noch ein Unterschied wie viel des virtuellen Speicher nachher tatsächlich im physikalischen Speicher landet und tatsächlich Ram verbraucht.
Im aller letzten Extremfall kommt seit Windows 10 sogar noch hinzu, dass Speicherinhalte gepackt werden, wenn der Speicher knapp wird, bevor sie in die Auslagerungsdatei wandern. So bekommt man letztendlich sogar mehr in den Speicher als man tatsächlich verbaut hat.
Was von den 1,2 GB also wirklich "gebraucht" wird ist gar nicht so leicht zu sagen und mittlerweile hat man ja auch echt genug Speicher, sodass einem selbst die 1,2 GB nicht wirklich weg tun dürften.
Ich nehme jedenfalls stark an, dass die Leute, die sich eine RTX-Karte leisten können, nicht nur 4 GB Ram im Rechner haben.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: CMDCake, Caffenicotiak und EMkaEL
Zurück
Oben