News KI für Sprachverständlichkeit: ZDF nimmt Tonspur „Klare Sprache“ ins Programm auf

Wennd das in "Echtzeit" passiert:
Wie hoch ist die Latenz, bzw. gibt es ein "Lippensynchronproblem"?

Muss das mal ausprobieren. Lieber stelle ich manuell den Sound ein, als dass Bild und Ton nicht synchron sind ...
 
branhalor schrieb:
Roboter, Autonomes Fahren, Smart Home, jetzt Sprach-KI im Fernsehen...
... so interessant das alles rein technologisch ist, so mache ich mir doch etwas Sorgen, wohin das gesellschaftlich und arbeitswirtschaftlich am Ende führen wird:

Von irgendwas muß der Mensch leben, und das geht seit Jahrtausenden bis heute nur über Arbeit und Geld-verdienen. Wenn aber langfristig jede Arbeit durch irgendeine Technologie und KI ersetzt worden ist => wovon sollen die Leute dann noch ihren Lebensunterhalt bestreiten...? In den Metropolen haben wir doch heute schon sozialen Unfrieden in den ärmeren Vierteln mit hoher Arbeitslosigkeit... Und es ist nicht jeder dafür geeignet, irgendeine Denk-, Forschungs- oder Entwicklungsarbeit in nem Büro oder Labor zu leisten.

Wie gesagt:
Inhaltlich spannend sind die Themen.
Aber leider auch spannend in Bezug auf die mittel- bis langfristigen, potentiellen Auswirkungen.
Ich hoffe, das hat auch irgendjemand auf den jeweiligen Entscheidungsebenen auf dem Schirm... 🙏 Sonst bricht das ganze Kartenhaus irgendwann in sich zusammen und wir haben am Ende wirklich die düstersten Zukunfts-Dystopien...
Handwerk. Seit ein paar Jahren sind IT Berufe bei den jungen Menschen sehr angesehen. Dafür ist bei Handwerksberufen ein großer Rückgang zu verzeichnen. In einigen Jahren, Jahrzehnte wird es wieder voll In sein coole Maschinen bauen zu dürfen ect.
 
Ich dachte das gibt es schon, nennt sich Synchronisation^^

Es ist klar, dass so eine Tonspur einigen Menschen helfen kann für sie ansonsten unverständliche Filme zu schauen, ich will also nicht diese Einführung kritisieren.

Aber grundsätzlich ist es doch eh schon so, dass auf Deutsch synchronisierte Filme wesentlich (!) verständlicher sind als Originalfassungen und da durch oft auch einiges an Atmosphäre verlieren.
 
Demon_666 schrieb:
Wennd das in "Echtzeit" passiert:
Wie hoch ist die Latenz, bzw. gibt es ein "Lippensynchronproblem"?
Es ist gemeint, dass diese zusätzliche Tonspur (genauso wie Medium-spezifische Auflösung und Codec) on-the-fly beim Senden für das entsprechende Medium erzeugt wird. Die zusätzliche Tonspur ist dennoch 100% synchron zum gesendeten Bild.
 
  • Gefällt mir
Reaktionen: chartmix, Alphanerd, Alex Shep und eine weitere Person
Guter Schritt vom ZDF, auch wenn ich das nicht schaue.

Corros1on schrieb:
Mich stört es, dass ich mehrmals im Film/Serien den Ton anpassen muss, dass ich überhaupt was verstehe oder mir in anderen Szenen nicht das Trommelfell platzen.
Einfach ohne rumfummeln an der Lautstärke, kann man kaum noch Filme genießen.

Ältere Filme konnten das viel besser haben mMn noch verstanden, worauf es beim Ton ankommt.
Heute wird man von Bässen zugedröhnt und versteht kaum noch was.
Da fragt man sich schon ob die Technik von damals besser war oder das Know-How der Tontechniker als Heute.
Das sehe ich auch so. Wir haben ein 5.1-System wo der Center permanent lauter als der Rest eingestellt ist, was das Problem ein wenig entschärft, aber es stört dennoch.

Da frage ich mich schon immer warum man nicht die Sprache in einer separaten Tonspur anbieten kann und man regelt die Lautstärke dieser dann auch separat.
(Ebenso wie ich mich frage warum man nicht das Bild in 16∶9 zur Verfügung stellen kann und jeder stellt selbst ein wie große schwarze Balken oben und unten man haben will, anstatt irgendwann nur noch einen dünnen horizontalen Guckschlitz zu haben.)
 
Gibt's das auch bei ARD? Tatort und Polizeiruf hätten das manchmal bitter nötig
 
Gute Sache! Auch wenn ich es selber nicht schaue, aber ich kenne viele die sich zB sehr über den Ton beim Tatort aufregen. Da sollen Musik und Effekte auch viel zu laut abgemischt sein. was ständiges nachjustieren bedingt.

Wegen der 720p Polemik: Also über DVB-S sieht das Bild von ARD und ZDF HD trotz 720p sehr gut (je nach Produktion) aus. Das muss wohl an der konstant anliegenden Bitrate liegen. Montag Abend Abenteuer Erde sieht zB fantastisch aus. Klar, mehr Auflösung wäre besser, aber schlecht ist das Bild wirklich nicht. Da sieht der Streaming Matsch von Netflix mit der variablen Bitraten mMn schlechter aus. Auch DAZN kann nicht bei Fußballübertragungen mit ARD und ZDF mithalten. Geguckt wird auf einem 65 Zoll LG OLED C Serie / 250 Mbit Leitung . Besonders der Rasen bzw die Fläche hat weniger Konturen und bei schnellen Bewegungen verliert DAZN endgültig.
 
  • Gefällt mir
Reaktionen: <NeoN>, Col. Jessep und Boimler
Reinheitsgebot schrieb:
Handwerk. Seit ein paar Jahren sind IT Berufe bei den jungen Menschen sehr angesehen. Dafür ist bei Handwerksberufen ein großer Rückgang zu verzeichnen. In einigen Jahren, Jahrzehnte wird es wieder voll In sein coole Maschinen bauen zu dürfen ect.

Das wird so nicht funktionieren.
Gerade im Handwerk gibt es immer mehr Automatisierungsprozesse, die menschliches Handeln entweder komplett überflüssig machen, oder es extrem reduzieren.
Gleichzeitig gibt es immer die gleiche Anzahl von Leuten, die aufgrund ihrer Intelligenz nur einfach(ere) Berufe ausüben können. Aufgrund der Breite der Bellkurve betrifft das hauptsächlich Männer.
Darüber redet aber niemand. Es wird sich nur beschwert, dass Männer gewalttätig seien (weil die meisten Insassen Männer sind), und dass das Berufsleben frauenfeindlich sei (weil in den höchstbezahltesten Jobs fast ausschließlich Männer sind).
Über die Schattenseiten der "Wildcard Mann" redet nur niemand. Wir sind genetisch, gesellschaftlich und im Partnerfinden komplett kontrolllos.
Frauen sind evolutionär gesehen immer die sichere, risikoärmere Wahl. (Abgesehen von gesellschaftlichen "Rand"gebieten, in denen Frauen "kultur"bedingt ein geringerer Wert zugesprochen wird - Hallo Indien, China und stark muslimisch-extremistisch geprägte Gebiete).
Es gibt bei der Zeugung sogar eigentlich einen starken Männerüberschuss, aber aufgrund der genetischen Instabilität (die auch diese breiten Verteilungskurven ermöglicht), "sterben" viele männlich-befruchtete Eizellen schon sehr früh, und daher gleicht sich das ungefähr aus.

Wir (als Menschheit) sehen uns so extrem vielen krassen Problemen konfrontiert, die viele einfach nicht verstehen, und das meiste vom Rest interessiert sich nicht, weil sie es für sich ausnutzen bzw. sie es einfach nicht tangiert.

Zum Thema:

Ich finde das toll, aber komisch.
Ich denke, hier wird das Pferd von hinten aufgezäumt. Ich wünsche mir auch gerne standardmäßig originale Tonspuren, aber ich denke hier gibt es mehrere Probleme, die dazu führen, dass der O-Ton zu mehr Aufwand und Problemen führt (Aufgrund der Bildfrequenz sind hier in Deutschland Filme länger, Lizenzprobleme bei der Musik, andere Schnitte aufgrund von bspw. Jugendschutz).
Wir haben doch Fernseher, die "alles" können (sollen). Wieso gibt es neben getrennten Tonspuren auch nicht bestimmte Verstärkungsprofile für Barrierefreiheit? Es gibt doch altersbedingte frequenzabhängige Gehörprobleme, davon Abseits sind Gehörtests doch immer schon frequenzspezifisch gewesen. Damit könnte man doch bestimmte Profile erstellen und laden.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Bigeagle
Mich nervt schon lange die unterschiedliche Tonqualität bei einigen Sendern.
Besonders fällt es mir bei Tele 5 auf, dort ist die Sprachausgabe generell leiser.
Ich habe eine Teufel Cinebar Lux + Sub dort gibt es auch die Option klare Sprache, bringt aber nicht viel.
Auch bei Netflix muss ich den Ton immer lauter machen wie bei einigen Fernsehsendern.
Die Tonqualität über die Raumfeld App und Spotify ist gut.

Und danke für die Info.
 
  • Gefällt mir
Reaktionen: Wasserhuhn
Ton 618 schrieb:
Mich nervt schon lange die unterschiedliche Tonqualität bei einigen Sendern.

Bei Kabelfernsehen ist auch die Bildqualität extrem stark unterschiedlich.
Vergleiche mal als Beispiel ARD in SD mit Sport1(?) in SD.
Die Kanalbreiten sind sehr unterschiedlich ausgeprägt. Spiegelt sich das Abseits der unterschiedlichen Lautstärke auch so bei den Tonspuren wieder?
 
branhalor schrieb:
Roboter, Autonomes Fahren, Smart Home, jetzt Sprach-KI im Fernsehen...
... so interessant das alles rein technologisch ist, so mache ich mir doch etwas Sorgen, wohin das gesellschaftlich und arbeitswirtschaftlich am Ende führen wird:

Von irgendwas muß der Mensch leben, und das geht seit Jahrtausenden bis heute nur über Arbeit und Geld-verdienen. Wenn aber langfristig jede Arbeit durch irgendeine Technologie und KI ersetzt worden ist => wovon sollen die Leute dann noch ihren Lebensunterhalt bestreiten..
Der Begriff Sklaverei sagt dir etwas? So wird es in Zukunft sein, nur dass die Sklaven keine Menschen sind, sondern Roboter.
 
Gute Sache, manchmal versteht man das gesprochene echt undeutlich.
Ich wäre dafür, dass besagter Algorithmus auch dieses bekloppte :innen rausfiltert,
Weil das, wenn auch auf andere art, die Sprache schlecht verständlich macht
 
Dass der Ton oft vermurkst ist liegt selten nur an einem Glied in der doch recht langen Kette von der Aufnahme bis zum Ohr. Aber einige Kettenglieder sind häufiger verbogen als andere. ^^
Bei mir liegts oft am downmix von DTS auf 2.1, wobei ich das in MPC ja immerhin anpassen kann. Manchmal ließ sich damit aus praktisch unverständlichem Sprach-Soundgemisch erstaunlich viel rausholen. Da haben Leute mit ordentlich eingerichtetem Mehrkanalsound ein Problem weniger.
Iirc können die Filmproduzenten sich auch nicht ganz einigen wie die Kanäle genutzt werden. Ich glaube auf Center liegt manchmal Sprache, Bass, oder nur basslastige verstärkung von Sounds.

Seit ich mehr streaming gucke statt von Scheibe gibts zwar kaum noch die völlig unpassende Konfig von der vorhergehenden 'reparatur' aber dafür die teils doch stark wechselnde Qualität die einem der Streaminganbieter hinwirft. Yay.

Ich vermute ja dass einerseits bei der Aufnahme weniger Wert auf verständlichkeit gelegt wird (es muss schnell gehen und 'das passt schon') und andererseits die Produktion im Wettbewerb um die Aufmerksamkeit der Massen eher das Effektfeuerwerk priorisiert. Die Leute müssen nicht verstehen was gesagt wird, sie sollen nur vor dem Bildschirm bleiben und dafür reichts wenn die Trommelfelle konstant 'betrommelt' werden und der Instinkt sagt 'pass auf, da passiert was!'
Schauspieler sind da auch so eine Sache, manche habens drauf gut zu reden, andere ... bewegen immerhin meist ihre Lippen dabei. Ich vermute mal man kann anhand der Verständlichkeit der Sprache (statistisch) ganz gut zuordnen wer aus dem Theatherbereich kommt und wer nur als Film-/Fernsehschauspieler eingestiegen ist.
Manchmal wird das bei der synchronisation umgekehrt, wobei glaube ich selten eine verschlechterung eintritt, zumindest was die reine Verständlichkeit angeht. Am Set nuschelt es sich leichter als in einer Aufnahmekabine.
Aber wenn wir pech haben heißt es später auch nur 'Die KI wirds schon richten', hauptsache beim abmischen gehen keine Soundeffekte verloren.
Nebenbei, verfälschen nicht viele Fernseher ohnehin Bild und Ton mehr oder weniger gelungen im Versuch einer Aufbesserung? Ich gucke nur am PC und habe bis auf madvr keine Aufbesserungen aktiv. Wenn ich alle paar Jahre mal woanders vor einem Fernseher sitze bin ich jedes mal negativ überrascht, ganz besonders wenn ich weiß wie es aussehen/klingen sollte weil ich den Film mitgebracht habe.
Genauso im Autoradio ... da habe ich schon die Lust verloren Musik zu hören weil ich nicht rausfand wie sich die krasse Nachbearbeitung abschalten ließ. Dabei würde ich nicht sagen dass ich ein gutes Gehör habe.

Corros1on schrieb:
Ältere Filme konnten das viel besser haben mMn noch verstanden, worauf es beim Ton ankommt.
Heute wird man von Bässen zugedröhnt und versteht kaum noch was.
Da fragt man sich schon ob die Technik von damals besser war oder das Know-How der Tontechniker als Heute.
Ich glaube ja schon dass die Mehrheit der Tontechniker immer noch Ahnung hat, aber letztlich machen muss was gefordert wird. Das wird nicht anders sein als in der IT, wenn der Auftraggeber will dass das Backup auf der USB Platte liegt die auf dem Server steht kann bekommt er das oft auch.
Es ist glaube ich auch noch kein großer Film finanziell gefloppt weil jemand zu schlecht verständlich war. Die könnten den nächsten großen Marvel Film komplett in genuschelt drehen und die Leute würden trotzdem kaufen. Da fehlt auch ein wenig der Ansporn darauf zu achten.
Früher gabs auch mehr Schauspieler und Produzenten die aus dem Theatherbereich kamen und daher viel mehr bewusstsein für deutliche Sprache mitbrachten.
 
Gab es das nicht bereits seit mehreren Jahren? Sofern man modernen Fernseher hat, sollte es doch fast keine Probleme mehr geben. Ich hatte damals im Jahr 2014 ebenfalls solch eine Einstellung und hörte schon gleich einen Unterschied. Wenn es dann immer noch Probleme gibt hätte ich noch ein Soundsystem, aber für mich waren bereits mit dem neuen Fernseher die Tonqualität verbessert worden.
 
Dimensionday schrieb:
Kannst du mir das bei mir erklären?
2x https://www.nubert.de/nuboxx-b-30/p4484/?category=355
1x https://www.amazon.de/Verstärker-integriert-unterstützt-Fernbedienung-Lautsprecher/dp/B07K7MYTXX/ref=sr_1_2?crid=24O1L9W0K5WFC&keywords=da2120c&qid=1654155135&sprefix=da212,aps,76&sr=8-2
Center kann ich nicht mehr anschließen, habe nur noch einen Aktiv Sub Out Ausgang, und trotzdem probleme mit Sprache ist zu leise oftmals :((

Hm, also die Boxen sollten für Sprache völlig ausreichen, generell sehen die Boxen recht gut aus. Also kann es eigentlich nur am Verstärker liegen und wie der abmischt, wenn Mehrkanalton kommt.

Habe eben bei Amazon nachgeschaut, aber wirklich nur kurz (!), also keine Gewähr, aber das nun 100%ig ist.
Q 1. Warum bekomme ich lautes Rauschen vom Fernseher über den optischen Eingang?
A: Bitte schalten Sie den Dolby / DTS-Sound auf Ihrem Fernseher oder Ihrer TV-App aus. Der DA-2120C unterstützt keine Dolby / DTS-Toneingabe.
Also wenn der Mehrkanalformate gar nicht verarbeiten kann, dann kann es natürlich massiv Probleme geben. Du wirst den ja vermutlich an PC und/oder TV angeschlossen haben. Vielleicht da das richtige Format wählen, damit er nicht mit Mehrkanal auf den Verstärker geht. Das ist natürlich leider blöd, weil es kann immer noch zu Problemen kommen, wenn gar kein 2.0 Format vorliegt. Oder es sehr schlecht ist. Schwierig. Ich kenne mich mit dem Gerät aber auch 0,0 aus, vielleicht lässt sich da noch was einstellen, mich wundert das eigentlich. 200 Euro sind ja gar nicht mal so wenig für so ein Teilchen. Im Zweifel kann man natürlich versuchen auf dem Rechner korrekt 2.0 oder 2.1 ausgeben zu lassen, damit da das korrekt gemischte Signal ankommt. Oder wenigstens ein passabel gutes. Leichte Einbußen wird man aber vermutlich immer haben. Mit 3.0 oder 3.1 ist man auf jeden Fall meiner Meinung nach viel besser aufgestellt, denn auf die Rear (also 5.1+) Lautsprecher kann man eigentlich relativ gut verzichten. Meistens ja nur Show und Effekt-Lautsprecher. Klar, nett, aber nicht absolut notwendig.
Es ist nicht immer einfach die korrekten Konfigurationen am PC einzustellen. Häufig sind die viele Settings am PC nur für die analogen Ausgänge, die aber kaum mehr einer benutzt. Also wenn die digitalen benutzt werden, muss man da extra genau hinschauen. Das ist oft ein echtes Gefrickel leider. Das war schon vor 20J+ ein Gefrickel und ist es leider geblieben. Wieso auch immer, so schwer ist es ja eigentlich nicht würde man meinen. :(
 
  • Gefällt mir
Reaktionen: Dimensionday
Demon_666 schrieb:
Wie hoch ist die Latenz, bzw. gibt es ein "Lippensynchronproblem"?
da das ja nicht erst bei dir zu Hause stattfindet wahrscheinlich 0. Entweder mixen die das vorher ab oder wenn on the fly wissen sie, der Rechenvorgang dauert 1337 ms, dann wird die videospur einfach 1337ms später als die audiospur gesendet.
Ergänzung ()

Felix# schrieb:
Mit 3.0 oder 3.1 ist man auf jeden Fall meiner Meinung nach viel besser aufgestellt, denn auf die Rear (also 5.1+) Lautsprecher kann man eigentlich relativ gut verzichten. Meistens ja nur Show und Effekt-Lautsprecher. Klar, nett, aber nicht absolut notwendig.
gibt es da nicht noch 3.1.2? da sind in der bar noch 2 noch obene gerichtete Speaker. lt manchen soll es die fehlenden hinten gut ersetzen können.
 
Dodo Bello schrieb:
d.h. weil alle Studios und aufgezeichneten Spielfilme den Ton nur abgemischt bereitstellen, werden am Ende einzelne Tonspuren per KI wieder identifiziert und aufgetrennt. Schon bissel von hinten durch die Brust.
gesetzt ich verstehe deinen Beitrag richtig...
da die Fernseher nicht in der Lage sind, zwei / mehrere verschiedene Tonspuren (Sprache, Musik, Hintergrundgeräusche, primäre Geräusche der Handlung, ...) zeitgleich wiederzugeben und dann auch noch zumindest die jeweiligen Lautstärkepegel anzupassen, bleibt nichts anderes übrig als alles in eine Tonspur abgemischt auszustrahlen.
Auch wäre es keine Lösung nur noch ausschließlich diese überarbeitete Tonspur zu verwenden, denn in dem Moment in dem man aus atmospherischen Gründen die Musik und den Sound im Hintergrund hören will, ist dieses klare Sprache Sprache Tonspur das letzte was man haben will. Es ist davon auszugehen, dass man als Zuschauer je nach Sendungsformat, mehrfach hin und her schalten wird.

Ich bin auf jeden Fall mal gespannt, und hoffe dass nicht nur Eigenproduktionen damit "überarbeitet" werden, sondern auch zugekaufte Filme und Serien und dass vor allem die digitalen Sendeplätze wie One und ZDF Neo, aber auch Arte und 3Sat damit bald zusätzlich versorgt werden.
Und wenn dann auch noch die anderen privaten Sender da nachziehen sollten, hätte ich absolut nichts dagegen (wobei die da vermutlich gleich wieder ein Bezahlfeature draus machen... also Satz mit X, das war wohl niX)
 
Deutsche Produktionen, vor allem Tatort und Krimiserien finde ich vom Ton echt häufig katastrophal. Da wäre mir echt lieber sie würden es nachsynchronisieren. Da hört man jedes Fußbodenknarzen, jeden quietschenden Stuhl, ständig und überdeutlich, es stört mich einfach. Hört sich halt echt an wie irgendein Zoommeeting mit einem Kollegen der halt seine Aufnahme volle Pulle hochgedreht hat bzw. sein Mikrofon viel zu sensibel eingestellt hat. Ich persönlich kann das überhaupt nicht ab. Bei englischen Medien gibt es das zwar auch aber bei weitem nicht derart massiv und störend. Leider glaube ich nicht, dass "klare Sprache" darauf Einfluss hat.
 
Zurück
Oben