News KI für Sprachverständlichkeit: ZDF nimmt Tonspur „Klare Sprache“ ins Programm auf

SVΞN

Redakteur a.D.
Registriert
Juni 2007
Beiträge
22.987
  • Gefällt mir
Reaktionen: flo.murr, zhompster, dasBaum_CH und 7 andere
d.h. weil alle Studios und aufgezeichneten Spielfilme den Ton nur abgemischt bereitstellen, werden am Ende einzelne Tonspuren per KI wieder identifiziert und aufgetrennt. Schon bissel von hinten durch die Brust.
 
  • Gefällt mir
Reaktionen: SteeL1942, AlphaKaninchen, up.whatever und 29 andere
Ich habe mich schon lange gefragt, warum es noch nicht möglich ist Sendungen in Mehrkanalton aufzunehmen bei denen Sprache und Geräusche getrennt sind und dies auch so auszustrahlen. Dann könnte das jeder für sein eigenes Gehör selbst einstellen. Bei Filmen, die synchronisiert werden, muss das Tonmaterial doch bereits in getrennter Form vorliegen. Stattdessen erhält man eine Mischung, in der Sprache extrem leise ist und Musik und Geräusche den ganzen Wohnblock aufwecken. Auf jeden Fall eine gute Entwicklung, da Menschen normalerweise älter werden, und dabei leider das Gehör schlechter wird.
 
  • Gefällt mir
Reaktionen: chartmix, Sascha631, nizr und 42 andere
Ich habe bei meinem Sony-TV in den Toneinstellungen "Klare Sprache". Nur bewirken tut das irgendwie nichts bis rein gar nichts. :D Ich bin mal gespannt, ob das die KI vom ZDF besser hinbekommt.
 
  • Gefällt mir
Reaktionen: Wallwatcher, Steueroase, Unioner86 und eine weitere Person
Funktioniert wahrscheinlich super bei Filmen mit Til Schweiger :D
 
  • Gefällt mir
Reaktionen: chartmix, nvidia4ever, flying_ass und 57 andere
r0b0t schrieb:
Ich habe mich schon lange gefragt, warum es noch nicht möglich ist Sendungen in Mehrkanalton aufzunehmen bei denen Sprache und Geräusche getrennt sind
Ganz so fortgeschritten muss man meist nicht mal vorgehen. Sprache wird bei Surround in vielen Fällen primär in den Center-Kanal gemischt und kann darüber leicht hervorgehoben werden. Funktioniert halt nur leider nicht, wenn man nur Stereo hat.
 
  • Gefällt mir
Reaktionen: TigerNationDE, Deinorius, Spike Py und eine weitere Person
Also bei manchen (primär englischen) Filmen würde ich mir sowas manchmal definitiv auch wünschen :D

r0b0t schrieb:
Ich habe mich schon lange gefragt, warum es noch nicht möglich ist Sendungen in Mehrkanalton aufzunehmen bei denen Sprache und Geräusche getrennt sind und dies auch so auszustrahlen.
Das wundert mich auch schon immer - Dolby, DTS...ganz tolle Features die zum Großteil von kaum einem Film wirklich genutzt werden, aber solche "Basics" werden ignoriert...
 
  • Gefällt mir
Reaktionen: Fusionator, douggy und Zibbe
r0b0t schrieb:
Ich habe mich schon lange gefragt, warum es noch nicht möglich ist Sendungen in Mehrkanalton aufzunehmen bei denen Sprache und Geräusche getrennt sind und dies auch so auszustrahlen.
Genau das frage ich mich auch immer, wenn ich schlecht abgemischte Filme oder Serien schaue, was leider die Regel als die Ausnahme mittlerweile ist.

Mich stört es, dass ich mehrmals im Film/Serien den Ton anpassen muss, dass ich überhaupt was verstehe oder mir in anderen Szenen nicht das Trommelfell platzen.
Einfach ohne rumfummeln an der Lautstärke, kann man kaum noch Filme genießen.

Ältere Filme konnten das viel besser haben mMn noch verstanden, worauf es beim Ton ankommt.
Heute wird man von Bässen zugedröhnt und versteht kaum noch was.
Da fragt man sich schon ob die Technik von damals besser war oder das Know-How der Tontechniker als Heute.
 
  • Gefällt mir
Reaktionen: chartmix, nvidia4ever, zhompster und 14 andere
Corros1on schrieb:
Genau das frage ich mich auch immer, wenn ich schlecht abgemischte Filme oder Serien schaue, was leider die Regel als die Ausnahme mittlerweile ist.

Mich stört es, dass ich mehrmals im Film/Serien den Ton anpassen muss, dass ich überhaupt was verstehe oder mir in anderen Szenen nicht das Trommelfell platzen.
Einfach ohne rumfummeln an der Lautstärke, kann man kaum noch Filme genießen.

Ältere Filme konnten das viel besser haben mMn noch verstanden, worauf es beim Ton ankommt.
Heute wird man von Bässen zugedröhnt und versteht kaum noch was.
Da fragt man sich schon ob die Technik von damals besser war oder das Know-How der Tontechniker als Heute.
Disney+ App ->Marvel -> Avengers: Infinity War = genau das wovon du sprichst, musste letzte woche bestimmt fast 100x Ton leise lauter stellen, Soundsystem: Nubert Nuboxx 30er Stereo mit Optical Vollduplex Verstärker... Pure Krise.
 
  • Gefällt mir
Reaktionen: Deinorius, Zibbe und Corros1on
Zum glück schau ich so gut wie kein Fernsehen mehr. Aber das mit dem Ton war schon immer ein Problem. Vor allem wenn man einen Film schaut und lauter machen muss um ein Wort zu verstehen und dann wenn Werbung kommt geht die Welt unter :D
 
  • Gefällt mir
Reaktionen: chartmix, Wallwatcher, Ray Donovan und 5 andere
r0b0t schrieb:
Ich habe mich schon lange gefragt, warum es noch nicht möglich ist Sendungen in Mehrkanalton aufzunehmen bei denen Sprache und Geräusche getrennt sind und dies auch so auszustrahlen.
Jeder zusätzliche Datenschnipsel braucht auch Bandbreite - und solange noch über Funk ausgestrahlt wird, ist die kostbar und begrenzt. Daher hat man von Spielereien wie verschiedenen Tonspuren etc. im Fernsehen früher häufig abgesehen. Ändert sich heut ein wenig. Aber einfach wie Netflix 5 Tonspuren und 10 Untertitel raushauen macht man auch heute noch nicht.

r0b0t schrieb:
Stattdessen erhält man eine Mischung, in der Sprache extrem leise ist und Musik und Geräusche den ganzen Wohnblock aufwecken.
Corros1on schrieb:
Genau das frage ich mich auch immer, wenn ich schlecht abgemischte Filme oder Serien schaue, was leider die Regel als die Ausnahme mittlerweile ist.
Das liegt wie schon gesagt einfach daran, dass bei Mehrkanal-Tracks die Sprache primär in den Center gemischt wird, und dann beim zusammenpressen auf Stereo nicht mehr gut rauskommt. Merkt man auch daran, dass bei einfachen Serien, die rein fürs Fernsehen gedacht sind das Problem nicht auftritt - die werden meist eh nur in Stereo produziert.

Eigentlich müsste man hier nur das Tool anpassen, dass von Mehrkanal auf Stereo drückt und dem Center mehr Gewicht geben.

Einfach Abhilfe wenn es zu sehr nervt: Eine Soundbar. Selbst die günstigen sind meist schon 3.0 oder 3.1 und haben dementsprechend einen Center. Seit ich meine Soundbar habe, hab ich mich nie wieder über schlecht verständliche Sprache geärgert und schaue viel mehr Filme auf Englisch, weil die ehemals unverständlichen Szenen jetzt verständlich sind. TV-Serien wie Big Bang, Two and a half man etc. hab ich dagegen auch vorher immer schon auf Englisch geschaut - weil die eh für Stereo produziert waren.
Aber ist natürlich ein bescheuerter Fix.
 
  • Gefällt mir
Reaktionen: Der Kabelbinder und Forum-Fraggle
Roboter, Autonomes Fahren, Smart Home, jetzt Sprach-KI im Fernsehen...
... so interessant das alles rein technologisch ist, so mache ich mir doch etwas Sorgen, wohin das gesellschaftlich und arbeitswirtschaftlich am Ende führen wird:

Von irgendwas muß der Mensch leben, und das geht seit Jahrtausenden bis heute nur über Arbeit und Geld-verdienen. Wenn aber langfristig jede Arbeit durch irgendeine Technologie und KI ersetzt worden ist => wovon sollen die Leute dann noch ihren Lebensunterhalt bestreiten...? In den Metropolen haben wir doch heute schon sozialen Unfrieden in den ärmeren Vierteln mit hoher Arbeitslosigkeit... Und es ist nicht jeder dafür geeignet, irgendeine Denk-, Forschungs- oder Entwicklungsarbeit in nem Büro oder Labor zu leisten.

Wie gesagt:
Inhaltlich spannend sind die Themen.
Aber leider auch spannend in Bezug auf die mittel- bis langfristigen, potentiellen Auswirkungen.
Ich hoffe, das hat auch irgendjemand auf den jeweiligen Entscheidungsebenen auf dem Schirm... 🙏 Sonst bricht das ganze Kartenhaus irgendwann in sich zusammen und wir haben am Ende wirklich die düstersten Zukunfts-Dystopien...
 
  • Gefällt mir
Reaktionen: futzi
  • Gefällt mir
Reaktionen: PusteBlume0815, Abrexxes, NJay und eine weitere Person
branhalor schrieb:
Wenn aber langfristig jede Arbeit durch irgendeine Technologie und KI ersetzt worden ist => wovon sollen die Leute dann noch ihren Lebensunterhalt bestreiten...?
Die Diskussion gibt's seit ca. 150 Jahren. Ich vermute, dass du trotzdem noch einen Job hast. Vermutlich sogar einen den es vor 70 Jahren noch gar nicht gab.
 
  • Gefällt mir
Reaktionen: chartmix, Benj, Spirit[Quaddict] und 17 andere
Gibt's ein opensource Tool dass das kann?
 
Infi88 schrieb:
Erstmal 720p überwinden wenn es geht.

Da bin ich auch mal gespannt, wann das kommen wird. Wenn ich das bei den Physikern richtig gelernt habe, ist 1080p per DVB-[x] technisch kein Thema.
 
Boimler schrieb:
Wenn ich das bei den Physikern richtig gelernt habe, ist 1080p per DVB-[x] technisch kein Thema.
Ich habe alle ÖR Sender auch bei Prime Video in FHD. Dennoch ist die Bildqualität über DVB-T2 deutlich besser als bei Prime Video. Das sind 1080p über DVB-T2. :D
 
  • Gefällt mir
Reaktionen: Boimler
Vernünftiges 5.1 oder größer Soundsystem kann helfen. Bzw. wenigstens 3.0/3.1. Center bringt sehr viel. Aber am meisten bringt es gute Boxen und ggf. einen gescheiten AVR zu haben. Das braucht gar nicht mal so teuer sein; Boxen kann man sich als Selbstbausätze relativ günstig selber bauen und dabei 10x und mehr sparen. Damit kann man sich ein traumhaftes HiFi oder in dem Fall Heimkino bauen, wo man niemals Verständlichkeitsprobleme haben sollte.
Wenn da nicht die Loudnesswars wären. Gute Aufnahmen sind ja eigentlich Aufnahmen mit großer Dynamik. Was laut ist, ist laut, was leise ist, ist leise. Dumm nur, wenn dann Werbung etc. volle Pulle in feinster Maximallautstärke der vorherigen kurzen Explosion dauerhaft kommt. Sowas geht gar nicht, allerdings kommt das bei mir gar nicht mehr vor: ich schaue nichts mehr mit Werbung. Es gibt ja bei nahezu allen halbwegs aktuellen (10-20J) alten AVRs und Verstärkern die Option "Midnight", womit man die Dynamik wiederum senken kann wegen Mietwohnungsproblemen usw, wenn man eben keine großen Lautstärkeunterschiede haben will.

Wofür es da nun KI braucht, bleibt mir ein Rätsel. Das Problem ist doch viel mehr Dynamik und Abmischung. Wenn man Optionen reinbauen würde, wo man Dynamik justieren könnte und sich die Abmischung automatisch gut (!) anpasst, wäre doch alles ok. Normalerweise würde man meinen, dass der Benutzer das ja selbst machen könnte. Gut ok - das geht heutzutage bestimmt nicht mehr. Und vielleicht braucht man genau dafür eine ... KI. Schlechte Soundsysteme, Anlagen und die meist verwendeten Brüllwürfel oder sogar nur die im TV verbauten Brülleimer - also wenn man die verbessern will, sollte man selbst einfach in Boxen investieren, die was können. Das bringt mehr als KI und man kann damit auch schön Musik hören und hat Jahrzehnte was davon.
Aber bevor man nur noch gleichlaut abgemischte Kram vorgesetzt kriegt, wo Stimmen genauso laut sind wie einschlagende Autos usw - ja dann ist eine KI vielleicht doch gar nicht so schlecht.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: bearnator, Knighty und Master_Chief_87
Ganz ehrlich, normal kritisiere ich sehr gerne die Öffentlichen, aber hier ist der Ansatz erstmal ein Guter. Gerade Abends/Nachts muss ich so häufig lauter/leiser stellen und manche Filme kann man gar nicht leise schauen.

Schöner wären natürlich getrennte Tonspuren für Sprache und Effekte.
 
  • Gefällt mir
Reaktionen: chartmix, Steueroase, zhompster und 4 andere
Zurück
Oben