Eine interessante Funktion ohne vernünftigen Anwendungszweck

Ich überlege, in diesem Blog die Rubrik «Interessante Funktionen, denen offensichtlich ein vernünftiger Anwendungszweck fehlt» einzuführen. Gut, sie bräuchte noch einen kürzeren und knackigeren Namen. Aber daran soll es nicht scheitern.

Ein Bild, das nur halb zum Thema passt, aber dafür eine junge hübsche Frau zeigt.

Der Auslöser für diese Überlegung ist die Sprachausgabe von OS X. In den Systemeinstellungen unter Sprache und Diktat zu finden sind. Man kann hier einerseits zur Eingabe von Text verwenden. Andererseits beherrscht der Mac auch die Fähigkeit, Texte vorzulesen. Damit kann man mit grossem Vergnügen während Stunden spielen. Ich habe die Sprachausgabe auch schon benutzt, um im Radio eine Assistentin bzw. einen «Sidekick» zu simulieren. Das ist aber ohne Zweifel ein Gag, den man nicht überstrapazieren sollte.

Eine Frage drängt sich aber auf: Kann man diese Funktionen auch sinnvoll verwenden? Für die Diktatfunktion (Mac-Grundlagen: Mit der Diktierfunktion Text sprechen statt einzutippen) kann ich mir das halbwegs vorstellen. Es gibt sicherlich Leute, die schneller diktieren als tippen. Je nach Situation, wenn man die Hände nicht frei oder dummerweise an beiden Händen den Zeigefinger gebrochen hat, ist dieses Feature eine Erleichterung. Da die Spracherkennung aber längst nicht fehlerfrei ist, ist der Aufwand für Perfektionisten (wie mich) weiterhin viel zu gross, mittels Diktat brauchbare Eingaben zu machen.

Für Blinde nicht geeignet
Der Zweck der Sprachausgabe ist mir noch weniger einsichtig. Man denkt natürlich sofort an die Einsatzmöglichkeiten für Blinde und Sehbehinderte. Von Gesprächen mit Betroffenen weiss ich allerdings, dass die eine Screenreader-Software benötigen, die beispielsweise auch eine Braillezeile unterstützt. Vielleicht setzen die auf den Sprachfeatures des Betriebssystems auf. Mit den Standard-Eingabehilfen der Betriebssysteme lassen sich leichte Beeinträchtigungen bei der Bedienung und Benutzung ausgleichen. Darüber hinaus braucht individuell auf die Nutzer zugeschnittene Hilfen und spezielle Programme. So arbeiten Blinde gerne im Textmodus, weil dort die Navigation sehr viel einfacher ist als bei grafischen Oberflächen. (Etwas anders sieht es bei den Smartphone-Betriebssysteme aus. Die lassen sich meines Wissens mit den Standardfunktionen auch von Blinden gut nutzen. Falls ich hier allerdings Quatsch erzählen sollte, lasse ich mich gern via Kommentarfunktion belehren.)

Ist die Sprachausgabe mehr als ein Proof of Concept? Man kann natürlich sich am Computer Artikel vorlesen lassen, statt selbst zu lesen. Aber nutzt das jemand?

Meine Experimente mit Anna, der deutschen Stimme von OS X, fielen sehr unbefriedigend aus. Damit der Computer das richtige vorliest, muss man sich erst die Mühe machen, den passenden Text auf der Seite auszuwählen. Das ist, je nach Komplexität des Layouts eine beträchtliche Hürde. Vereinfacht wird die Sache immerhin durch das Reader-Feature von Safari. In diesem vereinfachten Lesemodus reicht es, Ctrl + a zu betätigen, um das zu markieren, was man vorgelesen haben will.

Rechtsklickt man die Markierung an und wählt Sprachausgabe > Sprachausgabe starten aus dem Kontextmenü, legt der Mac auch schon los und man kann sich zurücklehnen, die Augen schliessen und die Darbietung geniessen…

Der Genuss ist getrübt
Wobei der Genuss, naja, immer mal wieder getrübt wird. Die orale Interpretation ist nämlich nicht so wirklich Annas Stärke. Anna deutscht englische Worte ohne jeden Skrupel ein. Sie pflügt durch den Text, ohne einen Unterschied zwischen Fliesstext, Titeln und Bildlegenden zu machen. Und sie liest allen Text, ob er nun heiter, amüsant, ernst oder todernst gemeint ist, in der gleichen roboterhaften Stimme. Was man ihr nicht übelnehmen kann, da Anna ein Sprachausgaberoboter ist. Natürlich, ich bin von den hervorragenden Darbietungen in meinen Hörbüchern verwöhnt. Dennoch könnte man sich daran wahrscheinlich gewöhnen.

Das eigentliche Problem ist, dass man Gebrauchstexte in aller Regel nicht brav linear von oben nach unten konsumiert. Man scannt, liest quer, sucht die Passagen, die einen gerade interessieren, und prüft die dann intensiv – so geht es zumindest mir, wenn ich recherchiere oder mich informiere. Das tun viele Leute so, wie man auch schon (nicht) lesen konnte: You’re not going to read this (The Verge) oder You Won’t Finish This Article (Slate).

Ich sehe das nicht a priori negativ: Bei dem Überfluss an Information muss man selektiv sein. Es ist eine Notwendigkeit abzuschätzen, wie man seine Zeit am besten investiert. Und darum hilft einem eine Frau nicht weiter, die nicht zwischen Wichtigem und Belanglosem unterscheidet, sondern beides in der gleichen Monotonie vorträgt.

Obwohl ich eingangs das Gegenteil behaupte, habe ich trotzdem zwei Einsatzzwecke gefunden: Ich lasse mir Anna (im Büro natürlich nur mit Kopfhörern) Texte vorlesen, bei auf die ich mich schlecht konzentrieren kann, die ich (aus Gründen) aber komplett absorbieren möchte. Das gibt es ja: Zeug, dass langweilig aufbereitet, lieblos präsentiert und viel zu langfädig ist, das aber trotzdem so viele nützliche Informationen enthält, dass man nicht darum herum kommt. Wenn ich da Anna vorlesen lasse, ist es egal, wenn meine Augen abschweifen und ich nebenbei noch etwas herumklicke (solange mich das nicht zu sehr ablenkt). Es gibt bei markiertem Text oder beim Klick in ein Textfeld auch der Befehl Als gesprochenen Titel zu iTunes hinzufügen. Damit lässt sich ein Text als Audioschnipsel in die Mediathek überführen. Das ist eine gute Methode, um die Texte in eine Warteschlange fürs Später-Hören zu legen. Sinnvoll wäre, wenn diese «gesprochenen Titel» via iCloud auch auf den iOS-Geräten landen würden, damit man sie sich anhören kann, wenn man am Perron steht und auf den Zug wartet. In meinem Fall hat das nicht geklappt; der iTunes-Match-Status bleibt auf Warten stehen. Allerdings scheint mein iTunes Match nach wie vor nicht richtig zu funktionieren.

140813-sprachsynthese-01.png
Texte fürs Späterhören aufheben.

Trotz postulierter Nutzlosigkeit: Hier noch ein Knüller-Tipp!
Und jetzt der noch mein Knüller-Tipp: Für die eigenen Texte ist das Vorlesen-Lassen sehr sinnvoll: Anna liest nämlich nicht das, was man als Autor meint, geschrieben zu haben. Sondern das, was tatsächlich dasteht. Also auch die Fehler, die stehen gebliebenen Wörter, die Satzfragmente, die falschen Anschlüsse, die Gedankensprünge, etc. pp. Durch Hören findet man die Fehler leichter als durch Lesen.

Nur schade, dass meine Beiträge in diesem Blog immer so lang sind, dass ich für diesen Kontrollschritt dann doch keine Zeit habe.

Footnotes

  1. In den Systemeinstellungen wählt man bei Diktat & Sprache in der Rubrik Sprachausgabe die gewünschten Einstellungen zu dieser Funktion. Wichtig ist, eine deutsche Stimme wie Anna zu installieren (geht per Mausklick). Man kann in diesem Dialog auch die Geschwindigkeit der Sprachausgabe und die Tastaturkürzel für das Starten und Stoppen festlegen. Siehe auch OS X Mavericks: Vom Mac gesprochene Texte ^top

Autor: Matthias

Diese Website gibt es seit 1999. Gebloggt wird hier seit 2007.

5 Gedanken zu „Eine interessante Funktion ohne vernünftigen Anwendungszweck“

  1. Ich habe das englische Pendant “KARREN” der MacOSX Sprachausgabe benutzt um bei meinem Spiel BALANZZE für iOS die Sprachasamples zu machen. So kann ich relativ einfach eine “fremde Frau” die irgendwie schon etwas sexy tönt, alles sprechen lassen was ich will. Klar habe ich hier 3 echte Frauen zuhause , die das auch könnten, aber mal sind sie nicht da, haben Kopfweh, sind bei der eigenen Arbeit oder mögen NICHT SCHON WIEDER ne Tonaufnahme machen. Also für mich hat sich die Sprachausgabe auf dem Mac sozusagen “bezahlt” gemacht.

    PS: Ich weiss nicht ob das bei iOS 7 auch schon geht/ging aber bei iOS8 kann man durch unterstreichen von oben nach unten mit 3 Fingern den momentanen Screen Inhalt vorlesen lassen. Einfach so streichen wie wenn man das Notification Center runterholen möchte, aber eben mit 3 Fingern ! Dann quatscht die alte drauf los !

Kommentar verfassen