Wie die KI unsere Bildrecherchen unterstützt

Mit KI finde man bei jedem Foto heraus, wo und und wann es auf­ge­nom­men wurde: Das haben Eupho­riker neulich in den so­zia­len Me­dien ver­kün­det. Ich über­prü­fe die Be­haup­tung und finde heraus: Wahr ist sie nicht – aber ganz falsch auch nicht.

ChatGPT sei hervorragend darin, herauszufinden, wo Fotos aufgenommen worden sind. Das behaupten Leute in den sozialen Medien und «Tech Crunch» hat daraus gleich einen Trend fabriziert. Gleichwohl ist der Grundgedanke spannend: Lässt sich mithilfe der KI herausfinden, welche Motive auf Fotos zu sehen sind, die wir in unseren Fotoalben finden, aber nicht mehr richtig zuordnen können?

Ich habe ein solches Experiment erstmals vor fünf Jahren – also noch vor ChatGPT – durchgeführt. Damals konnte ich den Ursprung eines meiner Fotos eruieren, das ich 1990 in Ungarn gemacht hatte. Das gelang nicht dank Google Lens oder anderen hochgezüchteten Bildanalyse-Algorithmen, sondern dank einer zweiten Aufnahme, die eine andere, vom gleichen Standort aufgenommene Perspektive zeigte. Darauf ist ein Gebäude mit einem Schriftzug zu sehen, der die Identifizierung als Móra Ferenc Múzeum in Szeged erlaubte.

Schafft die künstliche Intelligenz das auch? Und vor allem: Liefert sie eine schnellere und bequemere Verortung? Ich probiere es mit meinem ersten Foto, auf dem kein verräterisches Textelement vorzufinden ist. Ich verwende das Modell o4 Mini von ChatGPT, das für derlei Experimente besonders geeignet sein soll.

Hier also das fragliche Bild. Wie ich herausgefunden habe, zeigt es den Fluss Theiss. Rechts ist die Strasse Huszár Mátyás rkp. zu sehen:

Das Bild, das die KI verorten soll.
ChatGPT sieht Prag auf diesem Bild und liegt damit falsch.

Um die Pointe gleich vorwegzunehmen: ChatGPT scheitert an der Aufgabe.

Die KI vermutet das Moldau-Ufer in Prag, nämlich die gestufte Promenade am Smetanovo nábřeží. Allerdings erbringt schon eine kurze Inspektion mit Google Maps den Nachweis, dass das kaum stimmen kann. Ich stelle ChatGPT auch mein zweites Bild zur Verfügung: Dasjenige, das mich auf die richtige Spur brachte. Ich frage, ob diese Aufnahme seine These stütze. Der Bot von OpenAI nimmt es tatsächlich als Bestätigung:

Ja – auf diesem Bild erkennt man hinter den Bäumen deutlich den klassizistischen Portikus des Rudolfinums mit seinem sechs­säuligen Eingang. Das bestätigt den Standort Smetanovo nábřeží in Prag (Blick vom Mánesův most).

Zugegeben: Ich benötigte vor fünf Jahren das Filmnegativ und mein Makroobjektiv, um den Text lesen zu können. Das gibt mir einen unfairen Vorteil. Aber ich will nicht so sein und stelle der KI auch meine Ausschnittvergrösserung zur Verfügung. Mit der kommt ChatGPT zum gleichen Schluss wie ich – und wirkt etwas angesäuert: «Der Schriftzug lautet «A Közművelődéséért» – Ungarisch für «Für die Volksbildung». Damit ist klar, dass es sich nicht um Prag, sondern um das Móra-Ferenc-Museum in Szeged handelt.»

ChatGPT liegt leider daneben

Erste Erkenntnis: Hellsehen kann die KI bislang nicht. Was ich aber beachtlich finde, ist die methodische Vorgehensweise. ChatGPT gab mir zum ersten Bild folgende Analyse:

Anhand der abgebildeten Ikarus-Busse und der Farbverfärbung typischer Kleinbild-Filmaufnahmen würde ich den Zeitpunkt auf Anfang bis Mitte der 1990er-Jahre schätzen.

Die Busse habe ich nicht erkannt, und die Datierung ist einwandfrei: Die Bilder stammen von Anfang 1990. Wir lernen daraus, dass wir bei solchen Recherchen die KI als Hilfsmittel und Ideengeber betrachten dürfen, aber gut daran tun, die Behauptungen einer genauen Kontrolle zu unterziehen. Auf alle Fälle dürfen wir von ChatGPT Hinweise erwarten, in welche Richtung wir forschen könnten.

Google Gemini zieht einen falschen Schluss aus dem richtigen Indiz

Gemini verortet die Aufnahme in Dresden und liegt genauso falsch.

Für eine Zweitmeinung ziehe ich Gemini zurate. Googles KI vermutet als Standort Dresden und behauptet, wir würden von der Carolabrücke herunterblicken. Das lässt sich via Google Streetview sofort widerlegen. Dennoch liefert mir Gemini ein Indiz, das ich nicht auf dem Schirm hatte. Das Schiff sei die Szőke Tisza II, vermeldet diese KI.

Eine Google-Suche nach diesem Schiff führt sofort auf die richtige Spur: Der Wikipedia-Beitrag stellt die Verbindung zu Szeged her, ebenso die Website einer Stiftung, die sich diesem Schiff widmet. Hier finden wir sogar ein Foto, das eine ähnliche Perspektive aufweist wie meine Aufnahme. Eine weitere entdecke ich auf szegederarchivum.hu. Und so besteht kein Zweifel, dass es sich tatsächlich um dieses Dampfschiff handelt. Damit darf auch der Aufnahmeort als bewiesen gelten. Wie die Stiftung erklärt, liegt (oder lag) die Szőke Tisza II seit 1976 als Standboot vertäut an Ort und Stelle.

Fazit: Dank Gemini können wir dieses Bild verorten, ohne dass wir die zweite Aufnahme benötigen. Damit ist der Nutzen der KI bewiesen – auch wenn Google selbst anhand der richtigen Indizien zu einem völlig falschen Schluss kommt.

Na, wenn das mal nicht das Schiff auf unserem Bild ist!

Nachtrag vom 8. August 2025

NewsMän hat meinen Test weitergeführt und berichtet heute via Twitter, dass GPT 5 eine richtige Verortung des Bildes vornimmt – und zwar ohne jede weitere Angabe:


Das ist beeindruckend und auf alle Fälle ein wichtiger Hinweis für unsere weiteren Bildrecherchen. Nicht vollkommen ausschliessen würde ich allerdings die Möglichkeit, dass dieser Blogpost hier dem neuen Modell auf die Sprünge geholfen hat: Es kam nämlich bereits vor, dass bei Wiederholung eines Versuchs die künstliche Intelligenz einen meiner früheren Blogposts zum Thema herangezogen hat.

Beitragsbild: All diese Fotos näher zu bestimmen, artet trotz KI in echte Arbeit aus (Suzy Hazelwood, Pexels-Lizenz).

Kommentar verfassen