Text nach HTML konvertieren
Problemstellung:
Text aus einem Textverarbeitungsprogramm kann nicht einfach in die Homepage kopiert werden, er enthält Sonderzeichen oder Zeichen im ASCII-Format, die ohne Änderung vielleicht nicht richtig angezeigt werden.
Lösung:
Bevor der Text übernommen werden kann, müssen Textteile ausgetauscht oder ergänzt werden.
Das Python-Programm "text_nach_html.py" hat die Aufgabe,
- zeilenweise den Inhalt einer txt-Datei ("ein.txt") einzulesen, eine Zeile endet mit dem Zeilenumbruch
- jede Zeile nach Sonderzeichen oder bestimmten Zeichenkombinationen zu durchsuchen
- diese durch HTML-Code zu ersetzen
- den umgesetzten Abschnitt in die Ausgabe "out.html" zu schreiben
- das Ergebnis in eine HTML-Datei zu schreiben
Daneben stehen noch weitere Funktionen zur Ersetzung bzw. Ergänzung zur Verfügung. Diese müssen vor dem Lauf des Programms im Text eingebaut werden.
Soll ein Wort zum Beispiel als "<code>
" formatiert werden, kann das über die Eingabe von "qc" vor dem betreffenden Wort erfolgen. Die Eingabe von "qec" nach dem Wort hebt den Code-Block wieder auf.
Hier ein Beispieltext:
"Für die Ausgabe der Variablen antwort_auf_alles
nutzen wir die print()
-Funktion."
Um die beiden Code-Teile antwort_auf_alles
und print()
als solche zu kennzeichnen, muss der Text vor dem Programmlauf wie folgt ergänzt werden:
"Für die Ausgabe der Variablen qc antwort_auf_alles
qec nutzen wir die qc print()
qec-Funktion."
Die Fomatierung der Ausgangstextes ist dabei tatsächlich egal. Es geht genauso:
"Für die Ausgabe der Variablen qc antwort_auf_alles qec nutzen wir die qc print() qec-Funktion."
Übersicht der Funktionen:
-
Code
: "qc" wird ersetzt durch <code>, "qec" wird ersetzt durch </code> - Fetter Text: "qb" wird ersetzt durch <b>, "qeb" wird ersetzt durch </b>
- akternativ strong: "qs" wird ersetzt durch <strong>, "qes" wird ersetzt durch </strong>
- Kursiver Text: "qi" wird ersetzt durch <i>, "qei" wird ersetzt durch </i>
- Aufzählungen:
- "ql" wird ersetzt durch <ul>, "qcl" wird ersetzt durch </ul>
- "qo" wird ersetzt durch <li>, "qco" wird ersetzt durch </li>
-
Blocksatz: "qq" wird ersetzt durch <blockquote>, "qeq" wird ersetzt durch </blockquote>
ein ganzer Absatz als Beispiel
Hier der Originaltext:
Dies ist ein Beispieltext für das Programm „text_nach_html.py„.
Der Text enthält Zeilenumbrüche, die gebräuchlichsten deutschen Sonderzeichen wie ä. ö und ü, diese auch großgeschrieben, also Ä, Ö und Ü, sowie das „scharfe s“ ß.
Die Darstellung von Aufzählungen ist etwas komplexer:
• das liegt an der Beschaffenheit der Aufzählungszeichen
• der Anfang und das Ende müssen korrekt dargestellt werden
• sonst wird der folgende Abschnitt nicht korrekt dargestellt
Des Weiteren sind fett geschriebene oder kursive Textinhalte zu berücksichtigen. Und bei der Erwähnung von Codeteilen sollen diese in einer anderen Schriftart angezeigt werden.
Eingerückter Text mit anderer Formatierung wird in HTML als
erreicht und auch hier versteckt sich eine Besonderheit, die beiden Zeichen kleiner („<“) und „größer“ („>“)Soviel zum Beispieltext.
Was wir aber eigentlich anzeigen wollen ist das hier:
Dies ist ein Beispieltext für das Programm "text_nach_html.py".
Der Text enthält Zeilenumbrüche, die gebräuchlichsten deutschen Sonderzeichen wie ä. ö und ü, diese auch großgeschrieben, also Ä, Ö und Ü, sowie das "scharfe s" ß.
Die Darstellung von Aufzählungen ist etwas komplexer:
- das liegt an der Beschaffenheit der Aufzählungszeichen
- der Anfang und das Ende müssen korrekt dargestellt werden
- sonst wird der folgende Abschnitt nicht korrekt dargestellt
Des Weiteren sind fett geschriebene oder kursive Textinhalte zu berücksichtigen. Und bei der Erwähnung von Codeteilen sollen diese in einer anderen Schriftart
angezeigt werden.
Eingerückter Text mit anderer Formatierung wird in HTML als <blockquote> erreicht und auch hier versteckt sich eine Besonderheit, die beiden Zeichen kleiner ("<") und "größer" (">")
Soviel zum Beispieltext.
Damit der Text richtig übersetzt werden kann, hier die notwendigen Einträge in rot, alles andere macht das Python-Programm von sich aus:
Dies ist ein Beispieltext für das Programm "text_nach_html.py".
Der Text enthält Zeilenumbrüche, die gebräuchlichsten deutschen Sonderzeichen wie ä. ö und ü, diese auch großgeschrieben, also Ä, Ö und Ü, sowie das "scharfe s" ß.
Die Darstellung von Aufzählungen ist etwas komplexer:
ql- das liegt an der Beschaffenheit der Aufzählungszeichen
- der Anfang und das Ende müssen korrekt dargestellt werden
- sonst wird der folgende Abschnitt nicht korrekt dargestellt qel
Des Weiteren sind qb fett geschriebene qeb oder qi kursive qei Textinhalte zu berücksichtigen. Und bei der Erwähnung von Codeteilen sollen diese in einer qc anderen Schriftart qec angezeigt werden.
qqEingerückter Text mit anderer Formatierung wird in HTML als <blockquote> erreicht und auch hier versteckt sich eine Besonderheit, die beiden Zeichen kleiner ("<") und "größer" (">")qeq
Soviel zum Beispieltext.
Vorgehen:
- Herunterladen des Source-Codes (txt-Datei)
- Öffnen im Texteditor der Wahl
- Quellcode kopieren
- In Python-Editor der Wahl einfügen
- Erstellen der "ein.txt" im gleichen Order wie der Quellcode (das Bespiel ist ebenfalls im download-Ordner)
- Code ausführen
- der formatierte Text findet sich im leichen Ordner unter "out.html"
- Datei im Texteditor der Wahl öffnen
- Quellcodede kopieren und in der eigenen Homepage einfügen
- Fertig 😉