Textwäsche

Es ist unglaublich, wie viel Unfug man mit Texten anstellen kann. Und das meine ich jetzt noch nicht einmal inhaltlich – dort erstreckt sich das Feld der Missbrauchsmöglichkeiten unendlich in alle Richtungen. Nein, ich spreche von formalen Problemen: Doppelte Leerzeichen, unnötige harte Zeilenumbrüche, Leerzeilen, Zeichensalat – letzterer ist quasi unvermeidlich, wenn man es mit Texten zu tun bekommt, die per Mail übermittelt wurden. Hier werden Texte manchmal bis zur Unkenntlichkeit verhunzt, indem sie eingerückt, hart umbrochen und mit falschen Zeichencodierungen durchsetzt werden.

Hier hilft auf dem Mac ein Programm namens Textsoap. Es stellt eine Latte von automatischen Cleaners zur Verfügung – also gewissermassen Besen, mit denen man seine Texte ausscheuert. Diese Cleaners sind in zwölf Kategorien unterteilt. In der Kategorie Standard findet man die üblichen Methoden zur Bereinigung von Textdokumenten: Man entfernt mehrfache Leerzeilen, Zitat-Zeichen wie >, Tabulatoren, räumt Absätze auf, bereinigt die Anführungszeichen und und passt die Gross-/Kleinschreibung an.

130708-textsoap01.jpg
Den Text sauber schrubben.

In der Kategorie E-Mail räumt man durch Mailzitate verhunzte Texte auf und kann diese neu umbrechen oder die Zitatstufe anpassen. Bei Typographical ersetzt man drei Punkte durch richtige Auslassungspunkte und falsche Gedankenstriche zu richtigen Halbgeviertstrichen. Es gibt schliesslich auch Cleaners, mit denen man Markdown-Texte, HTML und Plist-Dateien editiert.

Die Cleaners, die man ständig benötigt, fügt man zu der Liste MyScrub hinzu und kann sie dann per Mausklick in einem Rutsch auf den im Editor geladenen Text anwenden. Ach ja, dort fügt man formatierten oder unformatierten Text aus der Zwischenablage ein oder man lädt Dokumente im Text- oder RTF-Format. Diverse Text-basierte Formate wie HTML können im Quellcode bearbeitet werden. Nicht möglich ist das Öffnen von Worddokumenten (Docx), aber diese kann man über die Zwischenablage einfügen.

Cleaners im Eigenbau
Das ist nützlich, aber noch nicht alles. Man darf auch individuelle Cleaners stricken. Diese baut man aus einzelnen Aktionen zusammen. Eine Aktion kann aus einem oder mehreren Schritten bestehen. Es gibt diverse eingebaute Aktionen, aber man kann auch seine eigenen einrichten. Vorhandene Aktionen sind Dinge wie Suchen-Ersetzen und Suchen-Ersetzen per regulärem Ausdruck (Regex Find and Replace Text). Mit Bulk Find and Replace Text kann man eine Reihe von Suchen-Ersezten-Läufe in einem Rutsch durchführen. Mit Find Text and Associate URL weist man einem bestimmten Text eine vorgegebene URL zu. Per Find Repeating Character ersetzt man mehrfache Zeichen durch eine andere Zeichenkette. Wenn man es mit euphorischen Autoren zu tun hat, die häufig mehrfache Ausrufezeichen ans Ende ihrer Sätze setzen, räumt man das auf, indem man mehrfache Ausrufezeichen durch eines ersetzt (aus «!!!!» wird «!»). Das kann man natürlich auch mit einem regulären Ausdruck bewerkstelligen – aber für Anwender, die mit der kryptischen Syntax nicht vertraut sind, ist die Arbeit mit diesem und ähnlichen Aktionen einfacher.

130708-textsoap02.jpg
Komplexe Reinigungsmethoden aus Aktionen bauen.

Das Angebot an Actions ist beachtlich. Es gibt bedingte Befehle (If Text Matches) und Aktionen für die Formatierung (Set Font, Adjust Font Size, Set Background Color, If Font Matches, etc.), die Möglichkeit, den Text zeilenweise zu bearbeiten (Add Prefix to LInes, Remove Prefix from Lines, Add Suffix to Lines, Remove Suffix From Lines) und man kann seine Texte auch sortieren (Sort Lines). Es ist möglich, Automator in seine Abläufe einzubeziehen und mit Apply Cleaner integriert man vorhandene Cleaner in seine Abläufe.

Nützlich für Textbearbeiter und -verarbeiter
Fazit: Textsoap ist ein hilfreiches kleines Programm für Leute, die häufig Texte bearbeiten und weiterverarbeiten müssen. Das Bearbeiten von Worddokumenten ist via Zwischenablage möglich, aber nicht sonderlich praktikabel – aber per Word oder in einem anderen Format angelieferte Texte für den Satz in InDesign oder einer anderen Layoutsoftware oder für die Publikation im Web aufzubereiten, beherrscht das Programm bestens. Das Programm kann somit sehr viel Zeit sparen und Arbeitsabläufe für Redaktoren oder Setzer massiv vereinfachen – gerade bei Anwendern, die sich mit regulären Ausdrücken oder der Programmierung einer Scriptsprache nicht auskennen. Auch für den gelegentlichen Gebrauch wäre das Programm durchaus hilfreich, doch mit 39 Franken im Mac App Store ist es dafür etwas teuer.

Autor: Matthias

Diese Website gibt es seit 1999. Gebloggt wird hier seit 2007.

Kommentar verfassen