Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
Ja, schon klar, aber wir sind uns doch darüber einig, dass das wohl ein Irrweg ist. Warum also gehst Du immer noch den Umweg über PDF, anstatt im proprietären Format zu speichern und das zu konvertieren?
@Pete11: Die einsetellungen sind so wie angegeben.
@G.O.Tuhls: Ich habe Templates und sehr viele Texte in Latex geschrieben. Texte mit Sonderzeichen, Formeln, Tabellen, Einbindungen von Bilder/Grafiken uvm. Das ganze in ein anderes proeritäres Format zu überführen ist nicht Zielführend.
Die konvertierte Datei habe ich mal mit der aktuellen Libreoffice 24.2.2.2 geöffnet. Es wird soweit ich bisher erkennen konnte alles akturat angezeigt. Das Problem mit der falschen Sprachversion bei der Rechtschreibprüfung scheint nur Word 2021 zu haben.
Wenn man diesem Blogpost glauben darf, ist der direkte Export nach docx mit diversen Problemen behaftet:
There are some known limitations, though. Numbering and referencing equations, figures and tables, and referencing sections will not work and you will have to number those by hand.
Nur bei Dir oder auch beim Kunden? Was möchte der überhaupt mit der DOCX-Datei? Je nach Word-Version, installiertem Drucker etc. geht die Formatierung doch eh den Bach runter.
Wer redet denn von einem anderen Format. Du willst doch unbedingt erst in PDF Exportieren, statt im originären Arbeitsformat (TeX) zu bleiben und dann von diesem Stand der die maximale Informationsdichte beibehält nach einer Lösung zu Doc/Docx zu suchen.
Die Dateien werden in PDF und DOCX übergeben.
Der Kunde stört sich daran, das Word immer mit der englischen Rechtschreibprüfung startet und die unbekannten deutschen Wörter rot markiert.
Abhilfe bisher:
Händisch Sprache für die Rechtschreibprüfung in Word 2021 in der Datei auf Deutsch umstellen und speichern. Dann ist der ganze Spuk vorbei.
Das mag so sein, bringt aber die Problemlösung nicht voran. Der Kunde zahlt, also bestimmt er auch. Der Auftragnehmer kann natürlich davon abraten. Wenn der Kunde dann immer noch sagt "Ich will aber!" kann man den Auftrag nur ablehnen. Der TE schrieb ja bereits selbst davon, dass er den Auftrag "leider" angenommen habe, sich also der Probleme durchaus bewusst war.
Keylan schrieb:
Wer redet denn von einem anderen Format. Du willst doch unbedingt erst in PDF Exportieren, statt im originären Arbeitsformat (TeX) zu bleiben und dann von diesem Stand der die maximale Informationsdichte beibehält nach einer Lösung zu Doc/Docx zu suchen.
Einige mögliche Gründe hatte ich weiter oben verlinkt. Davon ab, ist es völlig unklar, wie sich Word vehalten würde, hätte man das docx direkt erzeugt. Word ist, was die Erkennung von Dokumentensprachen angeht, notorisch unzuverlässig.
Oxymoron! Es gibt ein proprietäres Format und andere.
Warum stellst Du nicht einfach mal ein Muster.pdf zur Verfügung, an dem das jemand außerhalb Deiner Systemumgebung testen kann?
Wenn der Kunde Word will, dann will er bearbeiten. Ich würde ein aus pdf rückexportiertes Dokument da schon fast als Mogelpackung empfinden, weil eigentlich ist das nicht besser als ein pdf, richtig arbeiten kann man damit nicht ohne es erst mal auf die Word-Philosophie anzupassen.
Was die Sprache angeht: Es ist sehr wahrscheinlich, dass pdf24 beim Erstellen der Word Datei irgendeine interne Vorlage benutzt, und dort ist dann wohl englisch als Sprache eingestellt.
Ich kann wie gesagt auch nicht nachvollziehen, warum das Dokument beim Ändern des Formatmerkmals Sprache größer wird, eher vermute ich, dass Word von sich aus beim erstmaligen Speichern des geänderten Dokumentes irgendwelche Merkmale ändert und z. B. Schriften o. ä. einbettet.
Es ändert am Sachverhalt exakt nichts, wenn man Metadiskussionen beginnt, das wollte ich anmerken. Daher hab ich den ersten Teil deiner Antwort weggelassen. Hättest du nur den geschrieben, hätte ich mich nicht bemüßigt gefühlt zu reagieren.
Edit: Mal was zur Ursache des Problems, leider aber keine Lösung:
PDF24 nutzt die API von Aspose für die Umwandlung.
Schaut man sich in einer enpackten, zuvor konvertierten docx-Datei die Datei styles.xml an, findet man auch den Abschnitt, der die Sprache festlegt:
Aus diesem Grund öffnet Word das Dokument mit der voreingestellten Sprache "Englisch (Vereinigte Staaten)".
In einem mit einem deutschen Word erzeugten Dokument schaut der Abschnitt dagegen so aus:
Die API unterstützt das Setzen der Dokumentensprache, nur leider bringt das nichts, wenn der Teil bei PDF24 nicht konfigurierbar ist, denn der Standard ist:
@Evil E-Lex: Danke für die Hinweise.
Ich habe die docx-Datei mal unbenannt in *.zip. Danach kann man im Unterverzeichniss word die Styles.xml öffnen. Ein Austausch von <w:lang w:val="en-US" w:eastAsia="en-US" w:bidi="ar-SA" /> in <w:lang w:val="de-DE" w:eastAsia="en-US" w:bidi="ar-SA"/> bringt das gewünschte Ergebnis.
Die Datei wird mit der Deutschen Rechtschreibung geöffnet.
Leider kenne ich keinen Weg um das zu automatisieren.
Ich kann mir jetzt aus der Hohlen Hand (was mit höchst ironisch wäre) ein VBA-Makro vorstellen, das entpackt, die Datei sucht, öffnet, den Inhalt ersetzt und alles zurückrudert.
Persönlich würde ich ein kleineres Makro anstrengen das einfach die Prüfsprache auf Knopfdruck dokumentweit auf Deutsch setzt.
Da es sich wiederholende Aufgeben sind wäre ein größeres Makro, beginnend mit dem (Auf)Suchen und Öffnen der Quelldatei, zu empfehlen. Wenn nötig muss es gesplittet werden in Öffnen und Korrektursprache nebst Auswerfen als DOCX mit der richtigen Sprache als zweitem Schritt wenn mittendrin noch was zu korrigieren anfällt.