Wattwanderer schrieb:
Ich bin auch immer wieder überrascht über die fehlenden Fortschritte bei Übersetzungen. Überall scheint es technische Durchbrüche zu geben aber jedesmal wenn ich nach solchen Meldungen den Übersetzer anschmeisse muss ich feststellen, dass man von brauchbar noch weit entfernt ist.
Weil wir zwar unfassbare Rechenkapazität haben, aber der Ansatz trotz all dieser einer Brechstange gleicht.
Für eine richtige Übersetzung musst du die Regeln der Satzbildung haben, sprich ein syntaxorientierter System braucht Regeln, nicht unbedingt viele, je nach Komplexität der Sprache, aber er braucht sie gemeinsam mit der darunterliegenden Grammatik und dem Vokabular.
Was bei Google und dergleichen passiert sind Muster- und Häufigkeitsanalysen von Satzmustern (teilweise auch redigiert von echten Mitarbeitern) ... ein semantischer Ansatz. Ähnliche Sätze, die in der ein oder anderen Form schon existieren, werden erfasst und übersetzt. Gibt es hier nichts, wird zur Not Wort für Wort übersetzt. Wo sich Prädikat, Subjekt oder Objekt, Haupt- oder Nebensatz befinden, wird überhaupt nicht berücksichtigt. Tja, und weil so ein Ansatz dann recht schnell überfordert ist, kommt dann manchmal wenig Verständliches, im schlimmsten Fall auch komplett andere Übersetzungen heraus.
@CS74ES
Sich auf die Umgangssprache zu konzentrieren ist in diesem Ansatz völlig widersinnig, da es keine fixen Regeln der Bildung gibt. Dh, eine solche ist noch mal einen ordentlichen Zacken schwieriger, als Standarddeutsch, dass sich in Bildung und Ausdruck ja definieren lässt (siehe zB Duden). Mittels Muster- und Häufigkeitsanalysen klappt es meist irgendwie, weil sich viele Ausdrücke ja stark ähneln.
