Word: versteckte Textformatierungen finden oder sichtbar machen ?

Ekki-LM1

Lt. Junior Grade
Registriert
Aug. 2012
Beiträge
389
Hallo an Alle,

ich arbeite mit Word 2010 und füge über copy&paste öfter mal Text aus dem Web ein.
Eingefügt wird als "Plain Text", womit die Schriftformatierung des Word-Dokuments übernommen werden sollte, also z.B. Arial 12p.

Jetzt hatte ich wieder den Fall, dass ein Wort über die Word-Suche nicht gefunden wird.
Das Wort ist "Economy" u. wird schon mit Eintippen von "Eco" im Suchfeld nicht gefunden.

Wenn ich "Economy" in einen Texteditor reinkopiere u. die Datei in ANSI speichern möchte, kommt die Warnung, dass die Datei Unicode-Zeichen enthält.

Was ich nicht verstehe:
In Word kann ich das Wort in versch. Schriftarten formatieren, die auch genau so angezeigt werden.
Auch das Einblenden aller Formatierungssymbole zeigt keine "Sonderformate", trotzdem erkennt Word dieses Wort bei der Suche nicht, warum ?

Gibt es "versteckte Formatierungen", die trotz des Zuweisens anderer Schriftarten erhalten bleiben ?
Wenn ja, wie kann man diese finden bzw. sichtbar machen ?

Wäre sehr nett, wenn mir das jemand erklären könnte. Vielen Dank schonmal... :)
 
Danke, den Button kenne ich, er zeigt aber nicht an, ob bei einem Wort irgendwelche "Sonder-Zeichensätze" hinterlegt sind.
Die Tastenkombi ist ja dasselbe wie Rechtsklick -> "nur Text übernehmen",
hilft ebenso wenig wie der Pinsel-Button, womit die exakte Formatierung einer anderen Textstelle übernommen wird.
 
Ein Buchstabe oder alle in deinem Wort sind Sonderzeichen, z.B. gibt es ja diverse Zeichen die dem o gleich sind.
 
  • Gefällt mir
Reaktionen: madmax2010
@cloudman

Genau das ist der Effekt.
Zum Nachvollziehen, habe folgendes gemacht:

Das Wort "Economy" aus Deinem Beitrag in Word reinkopiert.
Dann Cursor auf andere Textstelle mit z.B. TimesNewRoman 8p und über Pinsel-Button das Format auf "Economy" übertragen.
Genau darunter das Wort "Economy" manuell eingetippt.

Über die Word-Suche wird das reinkopierte "Economy" nicht gefunden, das eingetippte aber schon, obwohl beide Wörter in TimesNewRoman 8p sind u. exakt gleich aussehen.

Genau das verstehe ich eben nicht: wenn Word doch "TimesNewRoman" anzeigt, welche Art von unsichtbarer Formatierung ist denn dann noch hinterlegt ?
 
Es sind andere Zeichen, die auch als TimesNewRoman angezeigt werden. Warum sollten sie auch nicht?
Mit Formatierung hat das nichts zu tun.

Auch das Pseudo-o sieht in TimesNewRoman aus wie das normale o.

wenn du in die Windows Suche "Zeichentabelle" eingibst, kannst du dir damit alle Zeichen anzeigen lassen der jeweiligen Font.
 
Das ist kein Formatierungsproblem
Da steht nicht Eco sondern Unicode Zeichen die so ähnlich aussehen
Im Screenshot ist oben die Fake Version und unten die korrekte Version.
Schwer zu sehen je nach Zeichensatz.
Deswegen der link wo man die hex Codes der Zeichen sieht.
Das E ist gar kein E sondern der kyrillische Buchstabe Ye
 

Anhänge

  • Screenshot_20220901-150020_Chrome.jpg
    Screenshot_20220901-150020_Chrome.jpg
    278,5 KB · Aufrufe: 182
  • Gefällt mir
Reaktionen: Gurkenwasser und Ekki-LM1
DANKE für Euer feedback u. sorry, wenn ich da immer noch etwas auf dem Schlauch stehe.

Wenn ich in Word meinen Text in Arial 8p formatiere, war ich immer davon ausgegangen, dass der Text eben in Arial 8p ist.
Im Bsp. oben haben das reinkopierte u. eingetippte "Economy" dieselbe Schriftart, sehen exakt gleich aus, haben aber unterschiedliche hex Codes, wodurch Word sie beim Suchen u. Sortieren anders behandelt.

Ich habe zig Word-Dateien, die u.a. auch reinkopierten Text enthalten und es wäre fatal, wenn die Word-Suche manche Wörter nicht findet, obwohl sie ja vorhanden sind.

Wenn im Word-Dokument ein best. Zeichensatz hinterlegt ist, kann man irgendwie rausfinden, ob im Text Wörter enthalten sind, die einen anderen Zeichensatz haben ?
 
Ekki-LM1 schrieb:
Genau das ist der Effekt.
Zum Nachvollziehen, habe folgendes gemacht:

Das Wort "Economy" aus Deinem Beitrag in Word reinkopiert.
Dann Cursor auf andere Textstelle mit z.B. TimesNewRoman 8p und über Pinsel-Button das Format auf "Economy" übertragen.
Genau darunter das Wort "Economy" manuell eingetippt.


Hast du auch verstanden, was er geschrieben hat?

Das aus dem Beitrag kopierte Wort, ist eben nicht Economy.

Sondern besteht aus Zeichen die gleich aussehen.

Also nur logisch, dass du sie über die Suche nicht findest.

Mal als Denkanstoß:

was passiert denn, wenn du das oben verlinkte Economy:
cloudman schrieb:
in die Suche kopierst?

Du suchst faktisch nach 2 verschiedenen Wörtern!
 
Versuch mal Courier New damit sieht man den Unterschied

Есоnоmу

Viele Fonts enthalten keine Symbole für diese "exotischen" Zeichen und sie werden dann einfach mit einem ähnlichem Symbol ersetzt
 
  • Gefällt mir
Reaktionen: Gurkenwasser
GutGilliganHyde schrieb:
Das aus dem Beitrag kopierte Wort, ist eben nicht Economy.
Sondern besteht aus Zeichen die gleich aussehen.
Du suchst faktisch nach 2 verschiedenen Wörtern!

Ja ok, das Problem bleibt aber, dass ich Wörtern oder Textpassagen im Web nicht ansehen kann, ob sie evtl. Zeichen enthalten, die nur so aussehen wie das Wort. Kopiere ich nun so ein Wort in Word, ist es auch dort nicht ersichtlich, was zur Folge hat, dass das vermeintlich gleiche Wort mal gefunden wird, mal nicht.

Nochmal konkretes Bsp., vielleicht gäbe es doch noch eine Lösung:

Ich pflege eine 200-seitige Word-Datei mit Musikinfos, die teils aus dem Web reinkopiert wurden.
Die Word-Suche nach einem Interpreten ergibt "0" Treffer, obwohl der Interpret aber vorhanden sein kann.
Ich kann also nie wissen, ob ein Interpret tatsächlich nicht vorhanden ist, oder nur deshalb nicht gefunden wird, weil der Name aus Sonderzeichen besteht.

Die Idee wäre, eine Word-Datei etwa in der Art zu durchsuchen: "finde alle Begriffe, bei denen der hex Code vom angezeigten Namen abweicht".
Oder die Datei mit einem Tool untersuchen lassen...? oder andere Möglichkeiten ?

Danke nochmal an Alle.
 
Danke für den Link.
Beim schnellen Überfliegen gelten die Encoding-Settings ja dann global für alle Word-Doc's.
Problem könnte sein, dass ich in manche Word-Dateien russische u. japanische Schriftzeichen reinkopiere, die beim Speichern exakt so erhalten bleiben sollen, weiß nicht, ob da was vermurkst wird, wenn ich die Settings verändere....
(muß mir den Link nochmal in Ruhe durchlesen)
 
Oder eine Schriftart verwenden wo man den Unterschied erkennt.
Such mal nach UTF-8 font oder probieres aus. Courier New ginge ist aber hässlich. Es gibt aber andere.

Wie man danach sucht weiß ich nicht.
Eventuell mit Makros aber Word kenn ich nicht so gut
 
Wenn das reinkopierte u. per Hand eingetippte "Economy" untereinander stehen, dann zeigt Font "Wingdings" die Unterschiede: gleiches Wort, aber unterschiedliche Symbole.
Hilft leider bei der Suche nicht, wo ich ja erstmal rausfinden will, ob ein Wort im Text vorhanden ist.

Wie hast Du in Deinem Beitrag #5 eigentlich das Wort Economy generiert ?

man liest Economy, aber tatsächlich ist es ein ganz anderes Wort, irgendwie abgedreht :rolleyes:
 
Ekki-LM1 schrieb:
Ja ok, das Problem bleibt aber, dass ich Wörtern oder Textpassagen im Web nicht ansehen kann, ob sie evtl. Zeichen enthalten, die nur so aussehen wie das Wort. Kopiere ich nun so ein Wort in Word, ist es auch dort nicht ersichtlich, was zur Folge hat, dass das vermeintlich gleiche Wort mal gefunden wird, mal nicht.


Dann musst du dir bessere Quellen suchen.

Das ist jetzt wirklich kein verbreitetes Problem, sondern wird wohl an deinen genutzten Quellen liegen.

Wo hast du die Info denn herkopiert?
 
GutGilliganHyde schrieb:
Das ist jetzt wirklich kein verbreitetes Problem, sondern wird wohl an deinen genutzten Quellen liegen.
aha, woher willst du das wissen ?
Es werden ja weltweit täglich Textpassagen, wahrscheinlich millionenfach, aus dem Web zur Weiterverarbeitung in Word kopiert.
Ich denke, vielen ist gar nicht bewußt, dass sie u.U. solche Wörter mit anderen Zeichen in ihren Doc's haben, weil man's eben nirgends sieht.
Das Problem ist durchaus gut bekannt, wenn man mit entsprechenden Begriffen danach googelt.

Ich nutze manchmal russische oder japanische Quellen, weil's best. Infos eben nur dort gibt.

@cloudman
Danke für den Link
 
Russische Quellen dürften Dein Problem. Klar kann es sein das dort ein Ye statt E vorkommen kann
Wenn du als Schriftart "Lucida Sans" nimmst sieht man gleich, dass etwas nicht passt.



1662119018714.png


Vielleicht findest du noch eine Schriftart die die Unterschiede noch deutlicher macht.
Die Rechtschreibprüfung kann auch ein Hinweis sein.
Mehr fällt mir dazu auch nicht mehr ein.
 
Zurück
Oben