Wer Augen hat, der sehe!

Mein Experi­ment, einen un­leser­lichen Text mit künst­licher Intel­li­genz zu ent­zif­fern, hat eine über­raschen­de Wendung genom­men: Das Rätsel wurde mit natür­licher, mensch­licher Clever­ness gelöst.

Neulich ging es hier im Blog um die Frage, ob es möglich ist, mithilfe von künstlicher Intelligenz einen unlesbaren Text lesbar zu machen. Ich habe zu diesem Zweck sogenannte Upscaler getestet.

Das sind Programme, die von sich behaupten, Fotos schärfer zu machen, indem sie die Auflösung erhöhen. Die getesteten Programme haben die Pixelzahl vervier- oder sogar versechtzehnfacht. Das Resultat war ernüchternd: Der Text bleibt in der hochgerechneten Variante genauso unleserlich wie im Original. Einer der Algorithmen hat zwar die Gesichter im Bild qualitativ massiv verbessert, doch der Text blieb so unleserlich wie am Anfang.

Die Erkenntnis aus diesem Experiment ist nicht überraschend: Software können Details dazu erfinden, wenn sie sich in einem bekannten Umfeld bewegen: Das menschliche Gesicht gehört zur Terra cognita, indem es Milliarden von Fotos gibt, anhand derer der Algorithmus Annahmen treffen kann. Vom Text, den ich der Software vorgelegt habe, gibt es jedoch nur ein einziges Bild, das so unscharf ist, wie abgebildet¹.

Bingo!

Nun hat Alfred einen Kommentar hinterlassen, indem er schreibt, seine «biologische OCR» würde den Titel «Asterix und der Löwenkind-Dieb» erkennen. Ich kann nicht mit hundertprozentiger Sicherheit bestätigen, dass das stimmt. Aber es fühlt sich richtig an und ist eine heisse Spur – viel heisser als das, was die Upscaler mir geliefert haben.

Nun, da ich auf dem Schlauch stand, habe ich nicht auf Anhieb kapiert, was Alfred mit der «biologischen OCR» gemeint hat. Ich habe nachgefragt und mir erklären lassen, dass er seine Augen benutzt hat. Jawoll: Kein digitaler Schnickschnack kam zum Einsatz, sondern analoge Lesefertigkeit.

Das ist eine so befriedigende Pointe für dieses Experiment, dass ich ihr einen eigenen Blogpost widme.

Mehr Selbstvertrauen, anyone?

Sie erinnert uns daran, dass wir angesichts des KI-Hypes unser menschliches Licht nicht unter den Schemel stellen sollten. Und ja, natürlich: Ich bin überzeugt, dass eine auf unscharfe Handschriften trainierte OCR-Software das Rätsel vielleicht auch geknackt hätte².

Aber eben: Man müsste sie erst mit Zehntausenden von passenden Beispielen trainieren. Im Gegensatz hat Alfred – dessen Augen von Haus aus offensichtlich besser auf unscharfe Buchstaben geeicht sind als meine – mit Hinsehen erkannt, was Sache ist. Damit bleiben wir Menschen die massgebliche universelle Problemlösungsmaschine – ohne, dass der Computer uns diesen Rang so schnell streitig machen wird.

Ach ja, und wo es doch um Asterix geht, kommen wir nicht umhin zu bemerken, dass der Titel eigentlich in Latein abgefasst sein müsste: «Qui oculos habet videt». Oder, noch etwas näher an der Bibelstelle mit den Ohren: «Qui oculos videre videt» – «Wer Augen zum Sehen hat, der sehe!».

Fussnoten

1) Die naheliegendste Lösung für dieses Problem habe ich bislang nicht verfolgt: Sie besteht darin, das Papierfoto zu suchen, das ich in der Digitalisierung für mein Experiment verwendet habe und es in besserer Qualität und höherer Auflösung zu digitalisieren. Das liegt daran, dass die analogen Bildbestände nicht gut erschlossen sind.

2) Natürlich musste ich dem Impuls nachgeben, den Text auch einigen OCR-Lösungen im Netz vorzusetzen. Keine davon hat nur etwas ansatzweise nützliches erkannt. Aber falls jemand einen Tipp zu einer OCR-Software hat, die auf schlecht reproduzierte Handschriften spezialisiert ist, dann wage ich mit der einen weiteren Versuch.

Beitragsbild: Auch die OCR-Funktionen sind überrragend (Subin, Pexels-Lizenz).

Kommentar verfassen