Nie mehr abtippen?

Die Trans­kriptions-App Steno im Test: Sie erspart Journalisten und Wissen­schaft­lern die un­lieb­same Arbeit der Inter­view-Ver­schrift­lichung nicht komplett, aber sie kann eine Unter­stützung sein.

Interviews abzutippen, ist etwas, das wir Journalisten sehr ungern tun. Ich werde daher immer mal wieder gefragt, ob es keine Lösung gibt, mit der man seine Aufnahmen automatisch verschriftlichen kann. Ich habe seinerzeit im Beitrag Youtube als Freund und Helfer für uns Interviewer auf die schönen Möglichkeiten von Googles Videoplattform hingewiesen: Die macht automatische Untertitel, die unter idealen Umständen ganz brauchbar sind. Man kann diese Untertitel auch abgreifen. Man kommt so also an eine Transkription heran, auch wenn der Weg dazu reichlich umständlich ist.

Links: Man kann entweder «live» übers Mikrofon transkribieren oder aber Aufnahmen über den Knopf rechts oben importieren.
Rechts: Das Resultat eines transkribierten Podcasts.

Darum musste ich natürlich sofort die App Steno (gratis, leider nur fürs iPhone und iPad) testen: Die hat einen reichlich irreführenden Namen, weil sie nichts mit Kurzschrift zu tun hat – auch wenn sie letztlich das gleiche bezweckt wie ein Stenograf: Einem eine Abschrift einer gesprochenen Konversation zu liefern. Die App kann eine Konversation live transkribieren oder aber eine Aufnahme in Text umwandeln. Mich interessiert natürlich vor allem die zweite Möglichkeit: Ich würde ein Interview erst einmal so aufzeichnen wollen, um es es notfalls halt auf die althergebrachte Art (d.h. mit F5) zu transkribieren.

Alles nur kein Deutsch

Eine erste Enttäuschung bei Steno gibt es gleich zu Beginn: Die App unterstützt zwar mehr Sprachen als bloss amerikanisches und britisches Englisch, nämlich auch Spanisch, Französisch, Mandarin, modernes Standard-Arabisch, Japanisch und brasilianisches Portugiesisch. Deutsch unterstützt sie bislang nicht und Züritütsch schon grad gar nicht. Ein Testlauf unter Realbedingungen mit einer authentischen, vor kurzem entstandenen Interviewaufnahme ist somit bedauerlicherweise nicht möglich.

Zu Testzwecken hätte ich wie bei meinem Youtube-Test wiederum mein Interview mit Richard Stallman heranziehen können. Aber da ich das auf die Schnelle nicht ohne Weiteres als Audiodatei aufs iPhone bekommen habe, musste ein englischsprachiger Podcast herhalten. Podcasts bekommt man nämlich mit vertretbarem Aufwand in die Steno-App hinein. (In Pocket Casts findet man im Teilen-Menü den Befehl Open File in…: Mit dem befördert man die Audiodatei in der Dateien-App von iOS 11. In Steno tippt man dann auf den Import-Befehl und öffnet über den die Audiodatei aus der Dateien-App.)

Es gibt einen zweiten Vorteil: Da ich eine Folge des Skeptoid-Podcasts (siehe Ein besserer Aufklärer als Facebook) verwende, kann ich das Transkript der App direkt mit dem Orignal-Transkript auf der Website vergleichen. Das ist allerdings kein Interview und entspricht damit nicht der eigentlichen Anforderung. Aber da die Audioqualität beim Podcast optimal und das Englisch gut verständlich ist, darf man ein einwandfreies Resultat erwarten. Wenn das nicht geliefert wird, ist völlig klar, dass die App in schwierigeren Situationen kaum verlässlich sein wird.

Transkription ab Audio-Datei

Hat man die Audio-Datei geöffnet, findet sogleich die Transkription statt – und zwar (über den Daumen gepeilt) in Echtzeit. Für ein stündiges Interview wird man eine Stunde warten müssen. Dann erscheint das Resultat in Textform, gekoppelt an die Aufnahme. Tippt man eine Textstelle an, kann man die entsprechende Stelle im Audio abspielen. Das hilft beim Korrigieren.

Hier der Anfang im Original:

Today we’re going to travel up the Hudson River Valley in New York, and back in time to the summers of 1983 and 1984. On many occasions, on clear summer nights, something terrifying and unexpected appeared in the sky. It was a gigantic craft, black as the sky, rimmed with bright lights in white, red, or green. It would drift over towns with a steady hum, witnessed by many. Police phone lines lit up every time it appeared, and the newspapers were choked with reports. It’s called the Hudson Valley UFO, and it’s one of the mainstays of evidence for those who believe we are not alone.

My friend Joe Miale is the director of the sci-fi movie Revolt (2017), and as it happened, the Hudson Valley UFO played as a big a role in his growth as all of my books on Bigfoots and ghosts did in mine. I asked Joe to tell his story:

Und hier das Transkript:

Today we’re going to travel up the Hudson River valley in New York and back in time the summers of nineteen eighty three and eighty four.

On many occasions on clear summer nights. Something terrifying and unexpected. Appeared in the sky. It was a gigantic crowd of black of the sky rimmed with bright lights in red white and green.

It would drift over towns with a steady home witnessed by many. Police phone lines were up every time it appeared in the newspapers were choked with reports.

It’s called the Hudson Valley UFO. And it’s one of the mainstays of evidence for those who believe. We are not allowed.

My friend Joey our is the director of the two thousand seventeen psi Phi movie report. And as it happened the Hudson Valley UFO played as big a role in his growth.

As all my books on Bigfoot and ghost did in mind. I asked Joe to tell his story.

Man sieht: Eigentlich gar nicht so schlecht. Die App hat vieles richtig verstanden und sich sogar an der Interpunktion probiert und Absätze gesetzt. Sie hat sogar gemerkt, dass sich Brian Dunning nicht an sein Manuskript gehalten hat: Er zählt die Farben der Lichter als «red, white, green» auf, und nicht als «white, red, green», wie im Manuskript geschrieben steht.

Alles andere als perfekt

Aber es ist nicht zu übersehen, dass sie immer mal wieder ein Wort falsch versteht und (wie nicht anders zu erwarten) mit Namen ihre liebe Mühe hat. Und leider unterscheidet sie auch die einzelnen Sprecher nicht – Joe, der dann im O-Ton spricht, wurde nicht als zweite Stimme gekennzeichnet. Für Interviews wäre das aber wichtig, weil man dann Fragen und Antworten nicht von Hand trennen und kennzeichnen müsste.

Das heisst: Man kommt um eine Nachbearbeitung nicht herum. Die muss überaus sorgfältig ausfallen, weil man das Risiko vermeiden muss, dumme, kleine Fehler zu übersehen, die die Bedeutung des Texts verändern. Die werden den Lesern des Interviews garantiert auffallen, da sie den Text zum ersten Mal sehen. Einem selbst entgehen sie aber extrem leicht, weil man genau weiss, was gesagt worden ist und wie es heissen müsste.

Deutsch gehört nicht zu den Sprachen, die die App versteht.
Rechts: Fürs Transkribieren muss man sich Minuten kaufen.

Der Aufwand für die Kontrolle dürfte somit annähernd so gross sein, wie der für eine manuelle Transkription. Und wenn man es mit vielen exotischen Wörtern, Namen oder Fachbegriffen zu tun hat, wenn ein Sprecher keine schöne Aussprache oder einen dicken Akzent hat oder die Aufnahme qualitativ nicht überzeugt (z.B. beim Telefoninterview) wird man fürs Korrigieren länger haben als fürs Selber-Abtippen.

Fazit: Auch Steno erlöst uns Journis nicht von dieser ungeliebten Tätigkeit. Aber ohne Zweifel geht die Entwicklung in die richtige Richtung – die Chancen stehen gut, dass die nächste, übernächste oder überübernächste Generation der Transkriptions-Apps eine echte Hilfe sein wird.

Man bezahlt pro Minute

Die Steno-App und eine halbe Stunde Transkription sind kostenlos, aber für weitere Verschriftlichungen muss man bezahlen. Die Preise sind einigermassen moderat: einen Franken für 50 Minuten, vier Franken für 250 Minuten und sieben Franken für 500 Minuten. Man kann die Transkripte automatisch hochladen lassen, nämlich bei Dropbox, Google Drive und der iCloud. Über die Trim-Funktion kann man auch nur einen Teil einer Aufnahme transkribieren. Allerdings ist diese Funktion gut versteckt (nämlich rechts oben im Resultatefenster). Falls ich nicht irgend etwas nicht begriffen habe, kann man eine Aufnahme erst trimmen, nachdem sie einmal ganz transkribiert wurde – das ist irgendwie sinnlos.

Die Bedienung ist auch sonst noch deutlich verbesserungsfähig: Ich würde es schätzen, wenn man die Sprache vor dem Start der Transkription wählen könnte und nicht in den Einstellungen hinterlegen müsste. Wenn man nämlich mit der falschen Einstellung loslegt, erhält man ein völlig unbrauchbares Resultat, und da man den Verschriftlichungsvorgang (anscheinend) nicht stoppen kann, vergeudet man so auch seine Minuten. Auch eine einfachere Möglichkeit, das Transkript in die Zwischenablage zu befördern, wäre hilfreich.

Kommentar verfassen