Neulich habe ich in meinem unergründlichen Bildfundus ein Foto entdeckt, das mich ungefähr mit zwölf Jahren zeigt. Ich bin mit einer meiner Schwestern zu sehen und halte ein Comic-Heft in der Hand, das ich ihr erzählt habe. Das Comic-Heft hat meine Neugierde geweckt. Es ist nämlich keines, das jemals im Handel erschienen wäre. Sondern eines, das ich selbst gezeichnet habe.
Damals wie heute hatte ich ein Faible für Asterix. Und damals habe ich das nicht nur als Leser, sondern auch kreativ ausgelebt. Ich erinnere mich vage an dieses Projekt. Aber leider nicht mehr an die Details – und sosehr ich mir auch das Gehirn zermartere, mir fällt nicht mehr ein, worum es in der Geschichte ging. Das Heft scheint nicht mehr zu existieren, und darum ist der einzige Anhaltspunkt dieses Foto – das aber unglücklicherweise gerade so unscharf ist, dass der Titel unlesbar bleibt.
Doch das ist kein Grund, den Mut sinken zu lassen – schliesslich leben wir im Zeitalter der künstlichen Intelligenz: Es vergeht kein Tag, auf dem mir nicht Facebook Werbung anzeigt, die eine mirakulöse Upscaler-Software anpreist. Es wird gezeigt, wie sich schummeriger Pixelmatsch in wunderbar scharfe, detailreiche Bilder verwandelt.
Das ist eine gute Gelegenheit, diese Versprechen zu prüfen. Und zwar mit einer simplen Aufgabe: Können diese Programme so viel Schärfe und Klarheit dazurechnen, dass der unlesbare Text hinterher lesbar ist? Als Laie wetter man dagegen. Aber es wäre toll, positiv überrascht zu werden.
imgupscaler.com
Der erste Testkandidat ist imgupscaler.com. Dieser Dienst lässt sich kostenlos online benutzen, allerdings nur für einzelne Fotos. Für regelmässige Nutzung kostet es: neun US-Dollar pro Tag, 19 Dollar pro Monat oder 69 Dollar pro Jahr.
Imgupscaler vergrössert das Original, das 1064 auf 1036 Pixel aufweist, um den Faktor vier pro Kante (4256 auf 4144 Pixel).
Das Resultat ist nicht schlecht: Imgupscaler entfernt Artefakte aus dem Bild, die dadurch entstanden sind, dass fotografisches Korn auf Kompressionsalgorithmen trifft. Das ist ein Gewinn. Der Text bleibt jedoch unlesbar – und die Anzeichen verdichten sich, dass auch eine KI keine Informationen herbeizaubern kann, die im Original nicht vorhanden sind.
Was macht die Software aus einem pixeligen Gesicht?
Aber es soll an dieser Stelle nicht nur um den Text, sondern auch um die Gesichtspartien gehen – denn wie menschliche Gesichtszüge aussehen, das lässt sich mittels KI hervorragend trainieren. Darum ist es hier möglich, Details stimmig dazuzuerfinden. Und so schlägt sich Imgupscaler:
Remini.ai
Zweiter Versuch mit remini.ai. Diese Software kostet zehn US-Dollar pro Woche. Man kann Bilder probehalber hochladen, aber nicht herunterladen und nur mit Wasserzeichen anzeigen lassen.
Remini verdoppelt die Kantenlänge (2128 auf 2072 Pixel) und arbeitet die Details weniger gut hervor. Das ist enttäuschend.
Doch bei der Mundpartie gibt es eine Überraschung: Die ist um Welten besser als beim Konkurrenten.
Das ist beeindruckend – insbesondere, wenn man das Original im direkten Vergleich ansieht:
imageupscaler.com
Der vierte Kandidat heisst fast wie der erste: imageupscaler.com. Er liefert ein Foto mit 4256 auf 4144 Pixeln, bei dem ich aber keinerlei Verbesserung der Details feststellen kann. Darum fällt diese Anwendung aus unzeremoniell aus dem Rennen.
Und wir wenden uns dem Fazit zu:
Das Rätsel bleibt ungelöst – doch das war zu erwarten gewesen
Das besteht aus zwei Teilen: Erstens in der Erkenntnis, dass das Rätsel nicht gelöst werden konnte. Wie zu erwarten war, bleiben Wunder aus: Wenn ein Foto zu wenige Informationen für die Rekonstruktion einer unbekannten Information enthält, dann kann die Software nichts ausrichten. Klar: Wenn es Bilder mit Schriftproben gäbe, wie ich damals meine Comics betitelt habe, dann liesse sich das Rätsel sogar knacken. Aber ohne konkrete Anhaltspunkte geht das nicht.
Zweitens ist verblüffend, wie unterschiedlich die Schärfe im hochgerechneten Bild ist. Manche Bereiche sind so schummrig wie zuvor – andere sind massiv besser. Daraus lässt sich ableiten, womit die Software etwas anfangen kann und womit nicht. Die erstaunlichen Resultate sind dort zu beobachten, wo sie sich in bekanntem Territorium bewegt. Wie menschliche Gesichter aussehen, ist ihr bekannt: Sie wurde mit Millionen von Beispielen gefüttert, was ihr erlaubt, aufgrund einer pixeligen Vorlage vernünftige Annahmen darüber zu treffen, wie das Gesicht mit mehr Schärfe aussehen würde.
Für die passenden Motive brauchbar
Das heisst keinesfalls, dass alle diese Annahmen korrekt sind. Mein Schneidezahn ganz links sieht zu eckig aus. (Nach heutigen Massstäben – dass er damals mehr Kanten hatte, kann ich nicht ausschliessen.) Aber wenn es nicht auf absolute historische Korrektheit ankommt, dann sind solche Mutmassungen vertretbar.
Erkennbar ist auch, dass die Artefakte nicht ganz verschwunden sind, sondern eine Art vertikale Knitterlinien hinterlassen haben. Die sind in anderen Teilen des Bildes noch störender sichtbar. Daher ist es einen Versuch wert, das Bild erst zu entrauschen und von den durch die JPG-Kompression verursachten Störungen zu befreien und erst in einem zweiten Schritt durch den Upscaler zu schicken. Ob das etwas bringt, werde ich bei Gelegenheit ausprobieren.
Beitragsbild: Auch dieses Bild wäre einen Versuch wert (Pascal Bernardon, Unsplash-Lizenz).
Zum ursprünglichen Problem der Texterkennung: meine eingebaute biologische OCR erkennt im Bild den Titel „ASTERIX der LÖWENKIND-DIEB“. Vielleich hilft dies der Erinnerung auf die Sprünge 🙂
Der Erinnerung bis jetzt nicht. Aber ich glaube, dass die OCR-App recht hat! 😲🙌