Die Krux mit den Sonderzeichen

Es gibt eine Reihe von Fragen, die der Kummerbox des Tagesanzeiger in schöner Regelmässigkeit gestellt werden. Eine der Top-Favoriten bei den Dauerbrennern sind die falschen Sonderzeichen und Umlaute. Diese gibt es immer seltener auf Websites. Bei E-Mails trifft man sie aber auch heute noch sehr oft an.

Dieses Problem gehört zu der ästhetischen Sorte. Ein Mail lässt sich trotzdem lesen und verstehen, wenn anstelle von ä, ü und ö seltsame Sonderzeichen, hierzulande nicht gebräuchliche Akzente, Codes oder Kästchen stehen. Lästig ist diese Sache allemal – vor allem dann, wenn man hört, dass man selbst der Urheber von solchem Zeichensalat ist.

Um zu verstehen, warum das Problem überhaupt entstanden ist, muss man sich vor Augen führen, wie Computer überhaupt Texte speichern und übermitteln. Auch die modernen Betriebssysteme und Anwendungsprogramme verwenden ein System, das tief in die Computer-Steinzeit zurückreicht. Die ASCII-Codierung wurde am 17. Juni 1963 von der American Standards Association (die US-amerikanische Normierungsbehörde, die heute American National Standards Institute heisst). Diese Codierung ging auf existierende Fernschreiber-Systeme zurück und regelte den Code von 26 alphabetischen Zeichen, 10 Ziffern und einigen Sonderzeichen wie Klammern und 33 nicht-druckbaren Steuerzeichen. Es wurde festgelegt, dass jedes Zeichen mit 7 Bit codiert wird, was Raum für 128 Zeichen liess. Internationale Zeichen, Umlaute oder Akzente gab es in diesem System nicht.

Dieses Zeichensystem war für den internationalen Gebrauch nicht geeignet und wurde darauf weiterentwickelt. Eine wichtige Erweiterung kam von der Digital Equipment Corporation, die das DEC Multinational Character Set. Es kam bei den VT220-Terminals zum Einsatz, die DEC zwischen 1983 und 1987 baute und es codiert Zeichen mit 8 Bit. Damit waren 256 unterschiedliche Zeichen möglich und auch Umlaute, Akzente und internationale Währungssymbole hielten Einzug.

Allerdings war auch das längst nicht genügend für den ganzen Zeichenvorrat von osteuropäischen Sprachen, Griechisch, Kyrillisch oder gar fernöstlichen Zeichensystemen. Es entstand daher die Normfamilie ISO 8859, die 15 verschiedene Acht-Bit-Zeichensätze definiert, die in den verschiedenen Regionen der Welt zum Einsatz kommen. ISO 8859-5 enthält kyrillische Zeichen, ISO 8859-7 griechische, ISO 8859-8 hebräisch, etc.
Bei diesen Zeichensystemen sind die ersten 128 Zeichen identisch. Sie entsprechen dem ursprünglichen ASCII-Zeichensatz. Die zweiten 128 Zeichen sind in jedem System separat belegt. Und das ist die Ursache des Problems: Wenn ein Text nicht mit der Codierung angezeigt wird, mit der er verfasst wurde, dann erscheinen bei den Zeichen falsch, die nicht zu den ursprünglichen ASCII-Zeichen gehören.

Eine weitere Entwicklung des Standards ist Unicode. Bei diesem Zeichensatz wurden ursprünglich 16 Bit verwendet. Mit Unicode gibt es (theoretisch) nur einen Zeichensatz, der für alle Schriftsysteme der Welt ausreicht – doch die Probleme sind damit nicht aus der Welt. Denn auch ein mit Unicode verfasster Text erscheint nur dann korrekt, wenn er auch als Unicode angezeigt wird. Ansonsten ist ein besonders chaotischer Zeichensalat das Resultat.

Bei Websites ist ein Hinweis auf die verwendete Codierung enthalten und auch in E-Mails wird diese Angabe mitgeschickt. Allerdings ist die Codierungs-Angabe nicht immer korrekt. Es kommt bei E-Mails auch vor, dass die während der Übermittlung umcodiert werden, was häufig nicht gut ausgeht.

So lange nicht die ganze Computerwelt auf Unicode umgeschwenkt ist, wird uns das Problem erhalten bleiben. Doch Probleme lassen sich mit einigen Einstellungen in den meisten Fällen vermeiden.

111123-kubo-klassiker_umlaute.jpg
Die heutigen Umlaut-Probleme haben ihren Ursprung in der Telex-Ära. Bild von ajmexico/Flickr.com

Wichtig ist, das Mailprogramm richtig zu konfigurieren. Hierzulande nutzt man ISO-8859-1 oder ISO-8859-15 (Westeuropäisch oder Latin-1 bzw. Latin-9). Man kann auch Unicode zum Versand verwenden; dann ist die Anzeige in fremden Zeichensystemen kein Problem.

Falls man ein Mail erhält, das falsche Codierungen enthält, kann man das bei der geöffneten Nachricht korrigieren – dazu ändert man die Codierungsangabe, bis die Nachricht korrekt erscheint. Falls anstelle der Umlaute nur Fragezeichen erscheinen, ist das allerdings nicht möglich. Dann sind die Umlaute während der Übermittlung definitiv verloren gegangen.

  • Bei Outlook lautet der Befehl Ansicht > Codierung. Bei Outlook 2010 findest du die Codierung im Menüband Nachricht unter Aktionen > Andere Aktionen > Codierung.
  • Bei Thunderbird klickst du auf Ansicht > Zeichencodierung.
  • Bei Apple Mail betätigst du E-Mail > Text-Codierung.
  • Bei Windows Live Mail 2011 findest du im Menüband Nachricht im Abschnitt Aktionen das Menü Codierung. Die Codierung der Nachricht, die du versendest, wählst du im Fenster Neue Nachricht im Menüband Optionen bei Extras.
  • Bei Outlook Express ändert man sie bei einer geöffneten Nachricht über Ansicht > Zeichensatz.
  • Bei älteren Versionen von Windows Live Mail bzw. Windows Mail verfährst du wie bei Outlook Express. Falls die Menüleiste ausgeblendet ist, bringst du sie durch Drücken der Alt-Taste zum Vorschein.

Die Codierung, die dein Mailprogramm standardmässig verwendet, legst du wie folgt fest:

  • Bei Thunderbird über Extras > Einstellungen in der Rubrik Ansicht. Klick im Reiter Formatierung unter Schriftarten auf die Schaltfläche Erweitert und gib bei Zeichenkodierungen die Standards für Ausgehende Nachrichten an. In Thunderbird gibt es ausserdem die Möglichkeit, die Codierung pro Ordner zu wählen. Die Angabe zur Standard-Codierung wird dabei ignoriert. Das tust du, indem du mit der rechten Maustaste auf einen Ordner klickst und die Option Eigenschaften auswählst. Du kannst bei Standard-Codierung die gewünschte Codierung angeben, die für alle Nachrichten gilt, die keine entsprechende Information enthalten. Wenn du ausserdem die Option Standard allen Nachrichten im Ordner zuweisen (individuelle Zeichenkodierung und autom. Bestimmungen werden ignoriert) einschaltest, werden alle anderen Angaben, auch die im Mail selbst und die unter Extras > Einstellungen getroffenen Angaben ausser Kraft gesetzt.
  • Bei Outlook 2007 und älter setzst du die Codierung über Extras > Optionen im Reiter E-Mail-Format. Klick auf die Schaltfläche Internationale Optionen und wähle bei Codierungsoptionen Westeuropäisch (ISO). Bei Outlook 2010 klickst du im Menüband Datei auf Optionen, öffnest die Rubrik Erweitert und scrollst zum Abschnitt Internationale Optionen.
  • Bei Windows Live Mail 2011 setzst du die Standard-Codierung, indem du auf die blaue Schaltfläche in der linken oberen Ecke des Programmfensters klickst, Optionen > E-Mail betätigst und im Reiter Lesen im Abschnitt Schriftarten auf Internationale Einstellungen klickst. Die Option Standardcodierung für alle eingehenden Nachrichten verwenden sollte nicht eingeschaltet sein. Die Codierung, die die abgeschickten Mails verwenden, stellst du im Reiter Senden bei Internationale Einstellungen ein.
  • Die Standard-Codierung überprüfst du in Outlook Express über Extras > Optionen im Reiter Lesen bei Internationale Einstellungen. Die Option Standardzeichensatz für alle eingehenden Nachrichten verwenden sollte nicht eingeschaltet sein. Die Codierung für ausgehende Mails setzst du im Reiter Senden bei Internationale Einstellungen.
  • Bei Windows Mail und älteren Versionen von Windows Mail verfährst du wiederum wie bei Outlook Express. Falls die Menüleiste ausgeblendet sein sollte, blendest du sie durch Drücken der Alt-Taste ein.
  • Bei Apple Mail triffst du die Vorgabe über das Programm Terminal. Beende Apple Mail, starte Terminal und gib den folgenden Befehl ein:
    defaults write com.apple.mail NSPreferredMailCharset “ISO-8859-1”
    Alternativ kannst du auch Unicode als Codierung wählen. Dazu dient folgender Befehl:
    defaults write com.apple.mail NSPreferredMailCharset “UTF-8”
    Sollte es nötig sein, die Standard-Einstellung wiederherzustellen, verwendest du diesen Befehl:
    defaults delete com.apple.mail NSPreferredMailCharset

Auch der Browser verwendet verschiedene Codierungen. Normalerweise ist die Vorgabe Automatisch die richtige. Bei verstümmelten Sites probiert man es mit Westeuropa (ISO) oder mit Unicode (UTF-8):

  • Diese Einstellung trifft man beim Internet Explorer unter Ansicht > Codierung,
  • bei Firefox: Ansicht > Zeichencodierung,
  • bei Safari unter Mac OS X: Darstellung > Textcodierung,
  • bei Google Chrome über das Schraubenschlüssel-Symbol (Google Chrome anpassen) und den Befehl Tools > Codierung,
  • und bei Opera unter Ansicht > Zeichenkodierung.
    Falls bei einem der Browser die Menüleiste fehlt, blendest du sie durch Drücken der Alt»-Taste ein.

Last but not least: Einige interessante Links zum Thema

Autor: Matthias

Diese Website gibt es seit 1999. Gebloggt wird hier seit 2007.

Ein Gedanke zu „Die Krux mit den Sonderzeichen“

Kommentar verfassen