UTF-8 mit XML Sonderzeichen

Conveam

Lt. Junior Grade
Registriert
Apr. 2008
Beiträge
332
Hallo,
ich benutzte in meinem XML-Feed UTF-8. Ist auch alles kein Ding - Der Feed ist Valid!
Ich habe auch die letzte Zeit alle Umlaute (ÄÖÜßäöü) umgeschrieben (ae, oe,...).
Das nervt allerdings langsam, und ich würde gerne die Umlaute auch als Umlaute in den Feedreadern erscheinen lassen.
Ist das möglich? Und wenn ja, wie?

Gruß
 
Ja, das ist ganz einfach möglich, du Umlaute müssen lediglich im korrekten Zeichensatz kodiert sein.


Wie das in deinem speziellen Fall geht, wissen wir nicht, dazu müsstest du uns erstmal mehr Informationen geben (z.B. wie der Feed generiert wird).
 
OKay, kein Ding.
Also ich füge jede Folge/Beitrag einzelnd zu. Ich hab hier mal das Grundgerüst:

Code:
<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
	xmlns:media="http://search.yahoo.com/mrss/"
>
<channel>
<title>*******</title>
<atom:link href="*******" rel="self" type="application/rss+xml" />
<link>*******</link>
<description>*******</description>
<itunes:summary>*******</itunes:summary>
<itunes:category text="*******">
<itunes:category text="*******"/>
</itunes:category>
<language>de</language>
<copyright>*******</copyright>
<pubDate>*******</pubDate>
<lastBuildDate>*******</lastBuildDate>
<managingEditor>*******</managingEditor>
<webMaster>*******</webMaster>
<image>
<url>*******</url>
<title>*******</title>
<link>*******</link>
<width>144</width>
<height>144</height>
</image>
<itunes:owner>
<itunes:name>*******</itunes:name>
<itunes:email>*******</itunes:email>
</itunes:owner>
<itunes:author>*******</itunes:author>
<itunes:explicit>no</itunes:explicit>
<ttl>1</ttl>
<item>
      <title>*******</title>
      <link>*******</link>
      <comments>*******</comments>
      <itunes:author>*******</itunes:author>
      <dc:creator>*******</dc:creator>
      <pubDate>*******</pubDate>
      <itunes:keywords>*******</itunes:keywords>
      <description>*******</description>
      <itunes:summary>*******</itunes:summary>
      <itunes:subtitle>*******</itunes:subtitle>
      <enclosure url="*******" length="*******" type="*******" />
      <itunes:duration>*******</itunes:duration>
      <guid>*******</guid>
      <itunes:explicit>no</itunes:explicit>
</item>
</channel>
</rss>

Und wie schon geschrieben - Feed ist vollständig valid.

Gruß, Con
 
Ich zweifle nicht daran, dass der Feed so valid ist.


Du musst uns erklären wie der Feed generiert wird, nicht wie er danach aussieht.


Wenn du in diesen Feed korrekt kodierte Sonderzeichen/Umlaute einfügst, dann wird es auch klappen.
 
Upps da hab ich mich oben falsch ausgedrückt. Also ich hab ihn aus mehreren Feeds zusammengestellt, und dann so angepasst das er valid war. Damit füg ich jedes einzelne "item" manuell zu, per Quelltext ändern.

Kein Programm, keine Website, nur ich.
 
Ok, und dann musst du dafür sorgen, dass dein Editor in utf-8 (ohne bom) kodiert.


Am besten du nimmst Notepad++ und stellst unter Format 'UTF-8 ohne BOM' ein, bzw. 'Konvertiere zu UTF-8 ohne BOM'.


Anschließend wird dir der Feed mit den korrekten Umlauten dargestellt werden.
 
Ich hab gerade mal öäü in den Titel geschrieben und dann mit Notepad++ mit UTF-8 ohne BOM gespeichert. Es wird kein Fehler mehr angezeigt. Danke dir!
Aber woher kommt das? Ich sehe keine Veränderungen im Quelltext (selbst öäü ist als öäü geschrieben)?

Gruß, Con

EDIT: Der Feed ist nun auch auf einer amerikanischen Website aktualisiert.
Dort werden Umlaute allerdings als ö z.B. angezeigt. Normal?
 
Zuletzt bearbeitet: (Zusatz)
Tu ich eig ungern aber ich tus ;) :
Link vom Autor entfernt
 
Zuletzt bearbeitet:
Ja, die Fehler sind mit dem Ändern der umlaute (ae=ä, usw) passiert. Hab alles auf einmal ersetzt gehabt. Jetzt sollte das aber laufen :-) .

Durch die andere Kodierung.
Wo sieht man das? Oben im Quelltext steht z.B. immer noch das selbe.

Gruß, Con
 
In Notepad++ steht sollte unten rechts 'ANSI as UTF-8' stehen. Wenn nur ANSI steht, dann hast du ein Problem.
 
Wenn der Feed UTF-8 kodiert ist und in einer Webseite dargestellt wird, die charset=iso-8859-1 (99% aller US-Websites?) kodiert ist, kann nur der Teil von UTF-8 richtig dargestellt werden, die mit dem amerikanischen Zeichensatz übereinstimmt, es sei denn, es werden beim Einlesen in die Site Zeichenumsetzungen durchgeführt (was i.d.R. nicht passiert).

Grüße Bernd (aka Elioth)

Diese Datei sollte bei der Analyse helfen:
ftp://ftp.unicode.org/Public/MAPPINGS/ISO8859/8859-1.TXT
 
Zuletzt bearbeitet:
Zurück
Oben