Trint.com, der hervorragende Interview-Verschriftlicher

Text Grabber, Onedrive, Finereader Online, F5, Youtube, Microsoft Dictate, Just Press Record und Steno verschriftlichen Apps, gesprochenen Text. Genau wie Trint, der hier ausführlich getestet wird.


Nie wieder abtippen!

Und das ist die Transkription des obigen Videos in trint.com, die man im komfortablen Editor auch fix nachbearbeiten kann.

Hier im Blog habe ich mich immer mal wieder mit der Möglichkeit beschäftigt, Informationen ab Kamera, Mikrofon oder Audiodatei in Text umzuwandeln. Das ist eine Konvertierungsaufgabe der etwas anspruchsvolleren Sorte – denn nur wenn man es richtig anpackt, kommt auch etwas Brauchbares dabei heraus.

Die verschiedenen Wege, aus Bild und Ton Text zu machen

Im Video sind die Tipps in gesammelten Form vorhanden. Konkret geht es um diese Apps und Webdienste, die nicht nur Ton, sondern auch fotografierte Dokumente in einen bearbeitbaren Text überführen:

  • Text Grabber digitalisiert Texte ab Kamera (ohne Format) und übersetzt sie bei Bedarf auch gleich.
  • Onedrive von Microsoft erfasst Texte in Bildern beim Hochladen automatisch.
  • Finereaderonline.com wandelt auch komplexe Layouts mit Bildern mehr oder weniger originalgetreu in eine bearbeitbare Datei um.
  • F5 ist die Lösung, wenn man ums Transkribieren von Aufnahmen nicht herumkommt.
  • Youtube erzeugt automatische Untertitel für Videos. Die kann man abgreifen und als Transkription verwenden.
  • Microsoft Dictate nimmt Texte in Word und anderen Office-Anwendungen entgegen. Leider nur ab Mikrofon, nicht ab Audiodatei.
  • Just Press Record ist eine iPhone-App, die sich mit Informationen ab Mikrofon und Audiodatei füttern lässt.
  • Steno transkribiert Audiodateien, u.a. in Englisch. Deutsch beherrscht die App leider bis jetzt nicht.

Natürlich habe ich auch nach neuen Diensten gesucht und bin dabei auf einen gestossen, der sehr interessant klingt – leider etwas zu spät, dass ich ihn fürs Video nicht mehr ausgiebig genug testen konnte.

Die Dreingabe: Trint

Das wird jetzt hier nachgeholt:

trint.com macht einen vielversprechenden Eindruck, indem man im vocab-builder ein persönliches Wörterbuch aufbauen und eigene Wörterlisten erstellen kann. Das sollte dazu führen, dass Wörter richtig erkannt werden, die normalerweise in Kauderwelsch erscheinen – weil man sie seltsam ausspricht, weil sie ungewöhnlich sind oder weil man sie leicht verwechseln kann.

Und sie hat eine Funktion, die sie im Vergleich zu den anderen hier vorgestellten Apps einzigartig macht: Sie kann mehrere Sprecher unterscheiden und wäre, wenn sie einigermassen gut funktioniert, die erste Wahl für Interviews.

Was macht der Algorithmus aus meinem Video?

Immerhin, einen Vorteil hat es, dass ich Trint im Video nicht berücksichtigen konnte: Ich kann nun das Umgekehrte tun und das Video in Trint berücksichtigen! Das heisst, dieses Video durch den Dienst hindurchjagen und das Resultat einer kritischen Würdigung unterziehen. Und das ist das Resultat:

Die Text Grabrede App erfasst kürzere oder längere Texte via Kamera und Suzie in eine Notiz um bei Bedarf können sie den erfassten Text auch gleich übersetzen lassen. Die App hat einen Live Modus der Texte kontinuierlich ab Kamera einfängt und anzeigt oder auch gleich übersetzt. So kann man recht unkompliziert Sprachbarrieren abbauen.

Doch sie brauchen noch nicht mal eine App Microsofts OneDrive erfasst den Text bei hochgeladenen Bildern automatisch. Sie finden ihn in den Eigenschaften der Fotos sie können ohne weitere Vorkehrungen auch nach Text in ihren Fotos suchen.

Feinripp online punkt com hilft bei komplexen Dokumenten wie dieser Zeitungsseite hier weiter. Sie laden den Text hoch geben Sprache und das Ziel Format an und erhalten nach kurzer Wartezeit das fertige Dokument zurück. Das Layard ist nicht perfekt nachgebildet dennoch alles in allem ist das Resultat verblüffend gut und zwar ohne dass sie auch nur ein Wort hätten. Abtippen müssen fein drehte Online-Poker kommen ist für Gelegenheit Nutzer kostenlos.

Bei Bildern funktioniert die Texterkennung akzeptable Qualität vorausgesetzt. Doch wie sieht die Sache bei Audio Aufnahmen aus. Denn viele meiner Kollegen würden ihre Interviews gern automatisch transkribieren lassen. Die gute Nachricht Es gibt Mittel und Wege schlechte Die funktionieren so Sola so dass man uns abtippen meistens nicht herumkommt.

Immerhin diese etwas antiquierte Maack Software erleichtert diese mühsame Arbeit beträchtlich. Man kann die Wiedergabe durch Tastatur Kürzel pausieren und es ist einfach zurück oder vorwärts zu springen und das wiedergab Tempo zu erhöhen oder zu verringern

wenn einem das Abtippen gänzlich zuwider ist kann man sich auch mit YouTube helfen. Die Videoplattform erstellt automatische Untertitel die unter idealen Umständen gar nicht so schlecht sind.

Zu seinen eigenen Videos kann man sie in verschiedenen Formaten herunterladen und auf diese Weise auch in eine Textverarbeitung kopieren.

Microsoft Diktate ist kostenlos für Office. Die Software erzielt bei der Transkription recht gute Resultate verarbeitet aber nur Diktate ab Mikrophonen

und schließlich die App just près rackert. Sie können direkt per iPhone diktieren oder auch Aufnahmen transkribieren lassen die sie per iCloud in die App geladen haben. Die Verschriftlichung ist brauchbar aber um eine Nachbearbeitung kommt man nicht herum. Wichtig in den Datenschutzeinstellungen muss die Spracherkennung für près Racket eingeschaltet sein.

Fazit: Das ist ziemlich grossartig – ganz ohne Training hat Trint eigentlich nur die Namen der Apps und Dienste verhauen, die Englisch und damit schwer verständlich sind. Mein leichter Schweizer Akzent war offensichtlich kein Nachteil.

Gute Audioqualität ist ein riesiges Plus

Ein Vorteil war auf alle Fälle, dass es sich um eine Audio-Aufnahme in Radioqualität gehandelt hat. Der Teil vor der Kamera, bei dem der Ton vom Ansteck-Mikrofon kommt und nicht ganz so gut ist, enthält denn auch drei von vier Fehlern, die ein deutsches Wort betreffen («soso la» statt «so so lala», «schlechte» statt «die schlechte [Nachricht]»; «uns» statt «ums»). Das einzige deutsche Wort, das im optimal aufgezeichneten Teil falsch verstanden wurde, ist «Mikrophonen» statt «Mikrofon».

Um die Nachbearbeitung kommt man auch hier nicht herum: Man muss Satzzeichen setzen, die weitestgehend fehlen und die ich deswegen oben im Text auch nicht markiert habe. Auch die Gross- und Kleinschreibung und die Zusammen- bzw. Getrennt-Schreibung von Worten ist nicht über alle Zweifel erhaben. Aber abgesehen davon ist Trint ein wirklicher Volltreffer – und ein weiterer Beleg dafür, wie rasant die künstliche Intelligenz (die natürlich auch hier zugange ist), Fortschritte macht.

Auch das Korrigieren ist komfortabel

Apropos Nachbearbeitung: Auch die ist komfortabel, da bei der Wiedergabe die Transkription synchron hervorgehoben wird, sodass man sofort sieht, was stimmt und was nicht. Man kann die Wiedergabegeschwindigkeit anpassen und leicht vorwärts und zurückspringen. In den Einstellungen kann man vorgeben, dass neue Sätze mit Punkt abgeschlossen werden sollen, dass nicht zu transkribierende Teile durchgestrichen werden können.

Keine Hintergrundgeräusche, die Stimmen nah beim Mikrofon, kein Geschwätz und klar verständliche Akzente sind die Voraussetzungen dafür, dass eine Aufnahme automatisch transkribiert werden kann.

Der Dienst transkribiert auch deutsche Inhalte, obwohl die Oberfläche in Englisch gehalten ist. Es gibt besagte Oberfläche in einer alten und neuen Version – ich empfehle, gleich die neue Variante zu benutzen.

Preispläne auch für Gelegenheitsnutzer

Als Probenutzer hat man dreissig Minuten kostenlose Transkriptionszeit zu gut. Man kann als Gelegenheitsnutzer pro Stunde transkribierter Inhalt bezahlen: 15 US-Dollar oder 25 Cent pro Minute. Es gibt auch zwei Abo-Varianten mit drei Stunden pro Monat oder zehn Stunden pro Monat, die vierzig bzw. 120 US-Dollar kosten (22 oder zwanzig Cent die Minute).

Das sind vernünftige Preispläne und 15 Franken, um ein langes Interview nicht komplett abtippen zu müssen, ist allemal ein sehr fairer Preis!

One thought on “Trint.com, der hervorragende Interview-Verschriftlicher

  1. Ich habe vor kurzem ein Video von 10 Minuten Länge transkribieren müssen (da ich den zu Grunde liegenden Text irrtümlich gelöscht hatte und ich den wieder brauchte). Per Zufall bin ich auf sonix.ai gestossen, ein Dienst der eigentlich auf Englisch spezialisiert ist. Nach 30 Minuten erhielt ich einen Text zugesandt, der mich nur staunen liess. Die Maschine hatte praktisch alles richtig „gehört“, bis auf ein paar wenige Fachausdrücke, die man auch hinterlegen könnte.
    Ich vermute, die beiden Dienste sind sich recht ähnlich, es wäre trotzdem spannend, den direkten Vergleich zu haben.

Schreibe eine Antwort zu RichardAntwort abbrechen