Die Vergangenheit entschlüsseln (nicht die eigene, wenns geht)

Wie mein Versuch, eine Sof­tware zur Hand­schrif­ten­er­ken­nung in einem Zeit­reise-Hor­ror­trip endete. Ein Test der Soft­ware gibt es trotz­dem.

Der gefährlichste Ort ist der eigene Haushalt. Dort geschehen nicht nur die meisten Unfälle. Es lauern auch Monster im Einbauschrank.

Mich hat neulich eines angefallen. Und zwar heimtückisch, als ich geschäftig und unbedacht die Tür geöffnet und hineingelangt habe. Der Arm ist noch dran, aber in meinem Oberstübchen herrscht ein Durcheinander.

Dabei begann dieses dramatische Erlebnis mit einer völlig harmlosen Vorgeschichte: Ich bin auf die Website transkribus.org aufmerksam geworden. Dort gibt es eine Texterkennung, die auch mit Handschriften klarkommt. Diese OCR-Anwendung ist auch auf historische Dokumente getrimmt und kann, so heisst es, die «Vergangenheit entschlüsseln». Man könne sogar eine «eigene KI für die Digitalisierung und Interpretation historischer Dokumente jeglicher Form» trainieren.

Klar! Transkribus ist ein Fall für mich und dieses Blog hier. Da ich kein Historiker bin, wollte ich einen simplen Probelauf mit meiner eigenen Handschrift unternehmen. Eigens ein Dokument verfassen wollte ich hingegen nicht. Denn erstens ist es meine Überzeugung, dass solche Tests immer unter möglichst lebensechten Bedingungen, d.h. in dem Fall mit existierenden Testobjekten abgehalten werden müssen. Und zweitens war ich zu faul, um eine Seite von Hand zu schreiben.

Wenn Selbstmitleid auf eine laue Pointe trifft

Darum also der Einbauschrank. Dort drin lagere ich viele handschriftliche Texte in Form von Tagebüchern. Respektive «Tage- und Nächtebücher», wie ich die seinerzeit genannt habe. Und eben: die sind voller Monster der Vergangenheit. Ich hatte natürlich noch eine vage Erinnerung, weswegen ich die damals geschrieben habe. Aber, heilige Scheisse!, wie dramatisch, seelenzermürbend, selbstzerfleischend und egozentrisch das war – das hatte ich erfolgreich verdrängt. Am schlimmsten sind diese Passagen, wenn Selbstmitleid auf den halbherzigen Versuch einer Pointe trifft. Ein einziges Beispiel soll das an dieser Stelle illustrieren: Am Ende des ellenlangen Eintrags vom Donnerstag, den 19. Matthiasuar (sic!) 1995 steht: «Kurt, leih mir deine Schrotflinte.»

Das Versprechen, Transkribus werde die «Vergangenheit entschlüsseln», könnte ich an dieser Stelle schon als halb eingelöst betrachten – noch bevor ich die Software überhaupt benutzt habe. Wobei ich aus vielen Passagen wirklich nicht mehr schlau werde. Ich kann mich nicht mal mehr an alle Frauennamen erinnern, die wie Kometen aus den Seiten schiessen. Andere Einträge wecken vage Erinnerungen. Einiges sollte mir wirklich peinlich sein.

Und manches zeugt davon, dass dieses Monster, das als Schatten aus meinem Einbauschrank gesprungen kam, damals real und bösartig war. Dass ich es dort in diesen Büchern einsperren konnte, war eine beträchtliche Leistung. Vielleicht ein Grund, stolz auf den Weg zu sein, den ich seitdem zurückgelegt habe?

Droht hier ein Projekt?

Weil ich mich kenne, ist mir klar, dass an dieser Stelle neues Ungemach droht. Vielleicht war dieses Monster in einer bestimmten Weise infektiös. Vielleicht hat es mich mit der Idee angesteckt, diese Bücher zu digitalisieren und etwas mit ihnen anzustellen. Ich könnte ihn in Popliteratur umarbeiten, die Jack Kerouac und von Stuckrad-Barre gleichermassen erbleichen lässt. Oder …

Oder ich bringe einfach diesen Softwaretext zu Ende.

Also, hat es funktioniert, mittels Transkribus eine (schliesslich willkürlich ausgewählte) Seite aus meinem Tagebuch zu digitalisieren?

Die Kunst ist, das richtige Modell zu eruieren.

Für die Texterkennung müssen wir ein Modell wählen. Zur Auswahl stehen geschlagene 203 Modelle; die sich über mehrere Parameter eingrenzen lassen: Ich wähle als Sprache Deutsch und gebe bei Centuries das 20. und 21. Jahrhundert an. Nun sind es noch acht Modelle, wobei die sich durch die Angabe bei Cer (Accuracy bzw. Genauigkeit) unterscheiden. Das ist eine Prozentangabe, bei der tiefer besser ist – weswegen man diesen Wert womöglich Ungenauigkeitsrate nennen sollte.

Ein Silber-«Fref» am «Fortzont»

Ich probiere es mit dem Modell Trug&Schein (T&S_HR_M1), das auf zwei Prozent kommt. Doch das erkennt fast gar nichts: «Fortzont» statt «Horizont», «Notiration» statt «Motivation», «Oestendins» statt «Geständnis» – völlig unbrauchbar.

Ich will einen zweiten Versuch mit einem anderen Modell unternehmen. Doch wie startet man den? Es sollte klappen, wenn wir zur Übersichtsseite zurückgehen, im Bereich Collections unseren Scan auswählen und auf Recognize klicken. Ich will es mit The Text Titan I probieren, doch das steht nur bezahlenden Kunden zur Verfügung – mehr dazu weiter unten.

Darum kommt German Giant I zum Zug: Dieses Modell liefert eine etwas bessere Erkennung, allerdings ist der Text noch immer kaum verständlich: «Wiederlöfun» statt «Wiederholung», «Hospent» statt «Horizont», «Geständuis» statt «Geständnis» – auch hier wäre eine sehr aufwendige händische Korrektur notwendig. Aber ich werde, wenn die Zeit es zulässt, weitere Tests mit anderen Modellen unternehmen.

Da besteht noch Luft nach oben.

Tipp: Um zwischen mehreren Transkriptionen umzuschalten, blenden wir via Uhren-Symbol die Version history ein: In der klicken wir die gewünschte Variante an, die über das Fortschrittsmenü auch mit einem Status versehen werden kann (In progress, Done, Final, Ground Truth).

Viele Erkenntnisse – sogar eine zur OCR

Fazit: Dieser Test hat vielerlei Erkenntnisse gebracht. Was die OCR-Software angeht, stellen Handschriften auch für die KI noch immer eine beträchtliche Herausforderung dar. Ich schreibe nicht unleserlich, wie ich finde. Doch für eine brauchbare Transkription käme ich mutmasslich nicht ums Training eines eigenen Modells herum. Das stelle ich mir aufwendig vor – und die ganze Arbeit nur, um weitere Monster zu wecken? Nein!

Die Arbeitsumgebung hinterlässt einen ausgereiften Eindruck: Sie ist offensichtlich für die anspruchsvolle, wissenschaftliche Arbeit ausgelegt und hilft dabei, Texte händisch zu transkribieren oder automatische Verschriftlichungen zu korrigieren. Was das Finanzielle angeht, haben wir für Tests 100 Credits zur Verfügung – eine Transkription gleich einem Credit.

Wenn das nicht reicht, gibt es bezahlte Preispläne für 14,90 Euro pro Monat (163,90 Euro pro Jahr) bzw. 59,90 Euro pro Monat für Teams (658,90 Euro pro Jahr).

Beitragsbild: Wie ein gruseliges Foto aus einem verbrannt geglaubten Familienalbum (Dall-e 3).

One thought on “Die Vergangenheit entschlüsseln (nicht die eigene, wenns geht)

  1. Ich bin gerade dabei, mit dieser Software alte Protokolle unseres Vereins zu digitalisieren. Diese sind noch in Kurrent und Sütterlin verfasst. Und leider hat alle paar Jahre der Aktuar gewechselt. Laut Transkribus lohne sich ein Training erst ab 50 Seiten aufwärts. Wenn man auf einen Autor trainiert, soll die Erkennung wesentlich besser werden. Für Dich könnte das einen Versuch wert sein. Aufwändig? Ja, Du müsstest um die 50 Seiten transkribieren und korrigieren.

    In meinem Fall habe ich es ohne grosse Hoffnung mit ChatGPT versucht. Und siehe da, ich war verblüfft. Aus dem extrem fehlerhaften erkannten Text macht er korrektes Deutsch und bei meinen Stichproben war der Inhalt korrekt. Im Gegensatz zu einer reinen Rechtschreibkorrektur verwendet er den Kontext. Deshalb kann er auch Worte korrigieren, bei denen kaum die Hälfte der Buchstaben stimmt.

Kommentar verfassen