Das iPhone oder den Mac für uns sprechen lassen

Am iPhone, Mac und über die Apple-Watch lassen sich Text­ein­gaben in Sprach­form aus­ge­ben – sogar mit unserer eige­nen, di­gi­ta­li­sier­ten Stim­me. Diese «Live-Sprach­aus­gabe» hilft Leuten mit Sprech­pro­ble­men und mit einer schlim­men Er­käl­tung.

In unserer Kummerbox-Live-Sendung vom Juni hat uns Hörer Jürg eine interessante Frage gestellt. Er leidet unter einer neurologisch bedingten Sprechbehinderung, die seine Aussprache schwer verständlich macht: «Wissen Sie, ob es eine KI-Anwendung gibt, die meine Aussprache erlernen und in Echtzeit in einen Text übersetzen könnte, den ich dann durch meinen Computer oder mein Smartphone vorlesen lassen könnte?»

Wir mussten damals passen. Aber siehe da, bei der letzten Updaterunde hat Apple die Betriebssysteme mit einer Funktion ausgestattet, die Jörg weiterhelfen könnte: Die Live-Sprachausgabe (Live Speech).

Sie ist zwar nicht ganz so ausgeklügelt, wie Jürg sich das wünscht¹: Sie kann nicht direkt die Aussprache des Sprechers quasi übersetzen. Stattdessen muss man seinen Text tippen und kann ihn dann vom Mac, iPhone oder iPad vorlesen lassen. Das funktioniert nicht nur direkt über die Lautsprecher, sondern auch bei Anrufen über die Telefon-App und via Facetime. Also eine überaus praktische Sache – auch für alle, die keine dauerhafte Sprechbehinderung haben, aber auch mal eine Erkältung erwischen, die auf die Stimmbänder schlägt.

Einfach zu benutzen

Der getippte Text wird vom iPhone vorgelesen.

Die Live-Sprachausgabe benötigt das neueste Betriebssystem (iOS 17, iPad OS 17, Mac OS Sonoma oder Watch OS 10) und ein verhältnismässig neues Gerät. Wir sind ab iPhone XS und mit einem Mac mit einem Arm-Chip (Apple Silicon) mit dabei.

Aktiviert wird die Live-Sprachausgabe bei iPhone OS und iPad OS über die Einstellungen bei Bedienungshilfen. Im Abschnitt Sprachausgabe tippen wir auf Live-Sprachausgabe und schalten die Funktion ein. Bei der Apple Watch funktioniert es genauso; beim Mac ist die Einstellung in den Systemeinstellungen unter Bedienungshilfen zu finden.

Jederzeit schnell zu aktivieren

Ist sie aktiv, wird die Sprachausgabe durch dreimaliges Drücken der Seitentaste eingeschaltet. Es erscheint ein Eingabefeld, über das wir den Text tippen. Wenn wir das iPhone oder iPad verwenden, scheint es mir sinnvoll, eine Bluetooth-Tastatur zu benutzen – weil sich dadurch der Text schneller eingeben lässt und das Gegenüber weniger lang warten muss. Es gibt ferner die Möglichkeit, in den Einstellungen bei Bevorzugte Phrasen Sätze zu hinterlegen, die sich bei Bedarf schnell abrufen lassen. Hier könnte man eine vorfabrizierte Erklärung hinterlegen, die am Telefon erläutert, weswegen das Gegenüber sich etwas gedulden muss.

Damit die Sprachausgabe nicht nach Siri oder nach sonst einer fremden Person klingt, gibt es die Möglichkeit, eine eigene Stimme zu trainieren. Das tun wir in den Einstellungen bzw. in den Systemeinstellungen in den Bedienungshilfen bei Eigene Stimme. Das ist allerdings Arbeit: Wir müssen 150 Sätze einsprechen, was ungefähr eine Viertelstunde dauert. Ich habe es ausprobiert und es funktioniert gut, auch wenn ich meine Stimme (siehe auch hier) in Echt dann doch überzeugender finde.

Fussnoten

1) Ich bin inzwischen jedoch dem Project Relate von Google begegnet, in dem es exakt darum geht, was Jürg sich wünscht. Es handelt sich um eine Android-App, die mittels KI darauf getrimmt werden soll, Menschen mit Sprachstörungen zu verstehen. Die App kann zuhören, die Aussagen transkribieren und in Apps zugänglich machen oder mittels Sprachausgabe in einer synthetischen, gut verständlichen Form wiederholen.

Ich finde das spannend: Es handelt sich um einen der Fälle, bei denen der Fortschritt nicht nur für die Allgemeinheit gedacht wird, sondern für eine Gruppe, bei der sie im Allltag einen umso grösseren Unterschied machen kann. Bislang wird Projekt Relate leider nur in Englisch entwickelt. Aber ich habe via Pressestelle von Google darauf hingewiesen, dass es auch in der Schweiz Interessenten an einer solchen Lösung gibt.

Beitragsbild: Das Smartphone als Sprachvermittler (Microsoft Image Creator zum Prompt «A person speaks into the phone, which speaks through a megaphone to another person. A funny illustration style»).

Kommentar verfassen