Text zu HTML Converter

MetalForLive

Admiral
Registriert
Sep. 2011
Beiträge
8.195
Hi,

Ich suche einen Text zu HTML Converter, dabei habe ich allerdings ein paar Anforderungen.
Leider konnte ich bisher keinen solchen Converter finden, daher wollte ich euch mal fragen ob ihr einen kennt der folgende Bedingungen erfüllt:

- Absätze soll durch </br> gezeichnet werden
- Text soll in UTF-8 dargestellt werden Beispiel: "Ich bin Müde" und nicht "Ich bin M&uuml;de"
- Soll kostenlos sein

Ob Online Converter oder Programm ist egal, da ich über 70 Texte habe mit bis zu 3000 Zeichen die in HTML Format convertiert werden sollen, möchte ich das ungern von Hand machen, da ich dann in nem Jahr immer noch daran sitzen würde...
 
Sollte in PHP ein kleines Skript recht schnell mit htmlentities und nl2br lösen. Insofern würde ich dir ans Herz legen, eine Suchmaschine zu verwenden, weil vermutlich schon mehr Leute auf die Idee gekommen sind.
 
Absätze werden in HTML mit <p>Absatz</p> erstellt.
Notfalls Script erstellen das dieses automatisch einfügt.
Converter gibt es da nicht wirklich denke ich.
Weil HTML auch nur Plaintext ist, welches durch eine Browser gerendert wird.
Oder versuch es mal Notepad++ und mach "Suchen & Ersetzen...".
 
Doch es gibt Converter z.B. diesen hier.

Der schreibt mir allerdings die Umlaute so:"&uuml; &auml" usw.
Ja momentan mache ich es mit suchen und ersetzen aber das ist eine leidige Arbeit

Ich verwende aber nicht <p></p> sondern </br> weil man damit flexibler ist was Absätze und Zwischenzeilen angeht, außerdem habe ich bei meiner Seite mit <p> teilweise Probleme was die Formatierung bei mobilen Enddevices angeht, manchmal verschwinden teile des Satzes einfach.
Daher muss es </br> sein.

Edit: Sorry ich meinte Zeilenumbrüche.
 
Zuletzt bearbeitet:
Schau mal Notepad++ Strg+F --In Dateien Suchen--> Verzeichnis angeben.
Alle Dateien reinschmeißen und drüberlaufne lassen
 
MetalForLive schrieb:
- Absätze soll durch </br> gezeichnet werden
Semantischer Unsinn. Absätze sind nun einmal <p>. <br> ist ein Umbruch, was semantisch eben was ganz anderes als ein Absatz ist.
Da HTML ein SEMANTISCHES Markup sein soll, solltest du dich auch an einfache Semantik halten.

- Text soll in UTF-8 dargestellt werden Beispiel: "Ich bin Müde" und nicht "Ich bin M&uuml;de"
Tool nehmen, dass Entities verwendet und dann im Nachgang die Entities einfach automatisiert ersetzen. Kann jeder gute Texteditor.

MetalForLive schrieb:
Ich verwende aber nicht <p></p> sondern </br> weil man damit flexibler ist was Absätze und Zwischenzeilen angeht
Wie gesagt, semantischer Nonsens. Deine Absatz-Abstände sind zu gering? Pass das Margin an.

außerdem habe ich bei meiner Seite mit <p> teilweise Probleme was die Formatierung bei mobilen Enddevices angeht, manchmal verschwinden teile des Satzes einfach.
Ich mach den Scheiß nicht erst seit gestern und zu unseren Kunden gehören auch ein paar Seiten, die tausende simultane User haben und deren User 75% Mobile-Devices verwenden.
Von solchen Problemen mit <p> hab ich noch nie gehört. Das klingt verdächtig nach "Ich hab irgend ein dämliches CSS-Framework wie Bootstrap genommen und dann nciht korrekt nachgebessert".


Für die Zukunft, wenn du mal wieder Texte schreibst, die später mal HTML sein sollen: http://de.wikipedia.org/wiki/Markdown
 
ich vermute auch mal er hat überhaupt kein css genommen :o
und du schlägst ihm das vor, was er bereits benutzt, aber nicht mehr benutzen will ^^

ich würde zu irgendeinem alten webeditor greifen. z.b. dreamweaver von vor 5-10 jahren.
kann mich entsinnen das frontpage auch noch zu <br> gegriffen hat.
ich schätz mal die sind aber schwer zu beschaffen ^^

und 70 texte mit 3000 zeichen mach ich dir in 3h, vielleicht sogar weniger. mit alex seiner methode.
erst ersetzen und dann <br> an jedes zeilenende
 
Ich kann <p> </p> auch nicht verknusen.
Und falls man CR bzw. CR+LF mal wie in Word annähme (ach, eigentlich in einer ganzen Menge an Editoren) dann wäre so ein Konstrukt in der Tat ein Absatz (und keine Zeile) den ich ganz bescheiden mit <br> unter Kontrolle bekomme.
Was den Literarischen Absatz ausmacht wäre damit Definitionssache.

Und da ich allenfalls alle diese p's dann global mit CSS anfassen kann und nicht wirklich einzeln muss ich für Individuailismus (z.B. »Margins anpassen«) so oder so Aufwand treiben. Daher übe ich auf den paragraph gerne Verzicht.
Und es musste nicht CSS sein, dass diese p's sich als garstig herausstellten. Über Word als HTML ausgeworfen decke ich den Mantel des Schweigens.

Für die Zukunft, wenn du mal wieder Texte schreibst, die später mal HTML sein sollen
Recht weise, aber nutzlos wenn man einen Satz alter Texte oder von Fremden verfasste verdauen muss… Dies zu den Sorgen etwas nicht erst seit gestern zu machen.

CN8
 
Das Problem ist, dass ich nicht nur die Absätze machen muss.
Ein bestimmtes Wort was im Text steht, bekommt immer die h2 Klasse und danach das Wort bekommt immer einen Großen farbigen Buchstaben.
Somit muss ich noch öfter mal im Text <span class="anfangsbuchstabe"></span> verwenden.
Damit ist der ganze Aufwand etwas größer.


Die Texte sind übrigens schon etwas älter, bei ca. 80% der Texte gab es noch nicht mal HTML.
Falls ich mal wirklich einen so langen Text schreiben sollte, werde ich mir Markdown mal ansehen.
 
cumulonimbus8 schrieb:
Ich kann <p> </p> auch nicht verknusen.
Und falls man CR bzw. CR+LF mal wie in Word annähme (ach, eigentlich in einer ganzen Menge an Editoren) dann wäre so ein Konstrukt in der Tat ein Absatz (und keine Zeile) den ich ganz bescheiden mit <br> unter Kontrolle bekomme.
Was den Literarischen Absatz ausmacht wäre damit Definitionssache.
Wir haben aber in vielen älteren Threads von dir schon umfassend festgestellt, dass du im Bereich "Webentwicklung und -design" alles andere als eine verlässliche Informationsquelle bist.
Also auch für dich noch einmal: Semantik ist wichtig!

MetalForLive schrieb:
Das Problem ist, dass ich nicht nur die Absätze machen muss.
Ein bestimmtes Wort was im Text steht, bekommt immer die h2 Klasse und danach das Wort bekommt immer einen Großen farbigen Buchstaben.
- <h2> ist keine Klasse, sondern ein Element
- Wenn es immer dasselbe Wort bzw. ein überschaubarer Pool von Wörtern ist, dann schreibt man sich dafür eben einen regulären Ausdruck (Suchstichworte: Regular Expression bzw. Regex) und verwendet ihn für Suchen & Ersetzen. Auch Notepad++ beherrscht Suche per Regex.
- Hier kommen wir mal nicht nur zur Semantik, sondern zur Syntax: Du DARFST <h*> nicht blind einsetzen und irgendwo hin werfen. z.B. darf das Element nicht innerhalb von <p> existieren. Innerhalb von <a> ist die Existenz nur in HTML5 zulässig, nicht aber in HTML4 oder XHTML 1.1.
- Wenn du jetzt eine saubere SEMANTIK hast, also dein Absatz nach dem <h2> tatsächlich mit einem <p> bezeichnet wird, wäre die Sache mit dem farbigen Buchstaben echter CSS-Pipifax.
Code:
h2+p::first-letter {color: blue; text-transform: uppercase;}
Siehst du? Dafür ist eine ordentliche Semantik auch gut: Sie gibt dir mächtige CSS-Selektoren mit auf den Weg.
 
Hä ja das mach ich ja auch so für dieses eine Wort.
Ändert aber nichts daran das ich immer nach diesen Wort den Anfangsbuchstabe der immer unterschiedlich ist mit der "anfangsbuchstabe" Klasse versehen muss.

Im Prinzip siehts so aus:


text blaa blaa blaa

WORT

Mehr text bla blaa

In HTML siehst dann bei mir so aus:

text blaa blaa blaa</br>
</br>
<h2>WORT</h2></br>
</br>
<span class="anfangsbuchstabe">M</span>ehr text bla blaa</br>

Den Text ohne HTML jage ich dann einmal durch den converter und ersetze alle <p> durch nichts und alle </p> durch </br>
Das Wort ersetze ich dann durch <h2>WORT</h2> und die Anfangsbuchstabe muss ich halt noch manuell machen.
Aber das geht auch.
 
Zurück
Oben