Eine App, die fast alles versteht

Whisper Memos ver­wan­delt ge­spro­chene Noti­zen in Trans­krip­te. Das Al­lein­stel­lungs­merk­mal: Sie versteht nebst Englisch und Deutsch auch Schwei­zer­deutsch und viele an­de­re Spra­chen.

Whisper Memos ist eine Notiz-App, die vielleicht euer Interesse weckt, selbst wenn ihr überzeugt seid, dass euer Bedarf in dieser Frage gedeckt sei. Denn in der Tat: Denn so gross die Auswahl auch ist, so unterschiedlich sind die Geschmäcker. Und ich würde Whisper Memos auch nicht als Ersatz für Evernote, Onenote oder (in meinem Fall) für Simple Note empfehlen – sondern eher als Ergänzung.

Die App, die es fürs iPhone gibt, hat genau ein Talent: Sie eignet sich für Leute, die unausgegorene Ideen oder fertig ausformulierte Texte nicht gern tippen oder handschriftlich erfassen, sondern am liebsten ins Telefon sprechen. Die App zeichnet sie auf, transkribiert sie und schickt sie uns als Mail zu. Wir können sie auch in der App durchlesen und von dort weitergeben – aber eine Bearbeitung in der App ist nicht möglich.

Das kann jede Notiz-App – oder?

Das ist auf den ersten Blick nicht spektakulär: Bei jeder Notiz-App lassen sich Einträge via Sprache erfassen. Dazu verwenden wir die Diktat-Funktion des Smartphones, die sowohl bei iOS als auch bei Android gute Resultate liefert¹.

Johann Wolfgang von Goethe ist für Whisper keine echte Herausforderung – nur der Zeilenumbruch entspricht nicht den Erwartungen.

Der entscheidende Punkt bei Whisper Memos liegt darin, dass die Spracherkennung von Open AI zum Einsatz kommt. Die heisst Whisper, ist als Open Source erhältlich, und sie bietet eine hervorragende Erkennungsleistung. Ich habe sie hier separat vorgestellt und mit anderen Transkriptions-Programmen verglichen.

Perfekt für polyglotte Menschen

Dabei hat sie sich in zwei Dingen hervorgetan: Sie ist nicht darauf angewiesen, dass wir die verwendete Sprache angeben. Und sie kommt mit Sprachwechseln problemlos zurecht.

Für meinen Test habe ich in der gleichen Aufnahme Deutsch, Englisch und Schweizerdeutsch gesprochen: Letzteres wurde in Hochdeutsch übertragen, das zwar etwas seltsam klingt, aber verständlich ist. Die beiden anderen Sprachen wurden im Original belassen und während meines kurzen Tests fehlerfrei übertragen. Wie üblich gilt, dass die Erkennungsleistung von der Tonqualität abhängt und je besser ist, desto weniger Umgebungsgeräusche vorhanden sind.

Bedingt auch für Interviews und Protokolle geeignet

Damit sind wir bei den Einsatzmöglichkeiten: Whisper Memos erfasst persönliche Notizen, aber die App kann auch für die Transkription von Gesprächen oder Sitzungen verwendet werden. Dabei sind folgende Dinge zu beachten:

  • Die maximale Länge liegt bei dreissig Minuten.
  • Die Audioaufnahme bleibt nicht erhalten.
  • Es findet keine Kennzeichnung unterschiedlicher Sprecher statt. Diese Funktion ist bei Whisper angedacht, bislang jedoch nicht realisiert.

Kostenlos können zehn Memos transkribiert werden; für mehr braucht es ein Abo, das 31 Franken im Jahr oder fünf Franken pro Monat kostet.

Fussnoten

1) Bei Android stellt die Google-Tastatur Gboard eine Diktat-Funktion bereit. Eingeschaltet wird sie in den Einstellungen bei System > Tastatur > Bildschirmtastatur > Gboard > Spracheingabe – schneller gelangen wir allerdings über die Suchfunktion zu der entsprechenden Option.

Beim iPhone werden wir in den Einstellungen unter Allgemein > Tastatur fündig, wo wir die Option Diktierfunktion aktivieren einschalten.

Beitragsbild: Er macht seine Notizen noch von Hand – vielleicht schaut er deswegen so unzufrieden (Michael Burrows, Pexels-Lizenz).

Kommentar verfassen