Wie man Fotos ohne Cloud verschlagwortet

Eine automatische Inhaltsanalyse von Fotos, die offline funktioniert: Das ist mit Excire möglich. Zwar leistet sich die Software gelegentliche Fehler und Auslassungen, ist aber trotzdem eine Empfehlung wert.

Regelmässige Leserinnen dieses Blogs werden festgestellt haben, dass ich eine pedantische Ader habe. Die zeigt sich nicht in allen Lebenslagen. Zum Beispiel habe ich kein Problem mit einem unaufgeräumten Büro. Aber in digitalen Dingen kenne ich keine Gnade. Darum habe ich neulich mein Blog auf Vordermann gebracht. Und ich kann mich mit Inbrunst um digitale Metadaten kümmern. Bei der Musik. Vor allem aber bei den Fotos.

Ich habe seinerzeit in Lightroom meine Digitalfotos akribisch verschlagwortet. Ich habe eine Bildlegende gesetzt und Stichworte vergeben und manchmal sogar eine ausführliche Beschreibung verfasst. Und das, nach den Ferien, bei Hunderten von Bildern. Und es war mir wichtig, die Bilder mit präzisen GPS-Daten zu versehen. Das war vor zehn Jahren recht aufwändig, aber ich hatte eine ausgeklügelte Methode entwickelt.

Ansatzweise neurotisch

Da ich keine Fotoagentur bin, war das ansatzweise neurotisch. Ich hatte irgendwann ein Einsehen und damit aufgehört. Auch aus äusserem Anlass. Das Verschlagworten von Bildern ist zeitraubend, und irgendwann war mir der Aufwand zu gross.

Ausserdem hat sich die Erkenntnis eingeschlichen, dass die ganze Arbeit vergebene Liebesmüh sein könnte. Wir erinnern uns: Vor zehn Jahren haben erste Programme gelernt, Gesichter zu erkennen. So wenig überzeugend diese Funktion anfänglich auch war, so hat sie einen trotzdem auf den Gedanken bringen können, dass es sich auf längere Sicht kaum lohnt, auf allen Fotos manuell die abgebildeten Personen einzutragen.

Und das war erst der Anfang: Die Bildersuche von Google hat vorgeführt, dass mittels künstlicher nicht nur Personen erkannt werden können, sondern auch Gegenstände. Es sind Apps aufgetaucht, die automatische Bildbeschreibungen generieren.

Automatisch verschlagwortet

Heute haben die meisten Bildverwaltungslösungen eine automatische Erkennung des Inhalts integriert. Es gibt sie bei der iCloud, sodass man am Mac, iPhone und iPad auch inhaltlich suchen kann. Das Gleiche gilt für die Fotos, die bei Onedrive von Microsoft deponiert werden und für die Fotos-App von Windows. Und wenn man sich ansieht, wie gut Google Lens heute ist, den Inhalt eines Fotos zu erfassen, dann kommt man unweigerlich zum Schluss, dass sich die Verschlagwortung nicht mehr lohnt.

Mit einer Ausnahme: Es lohnt sich nach wie vor, Dinge in Bilder hineinzuschreiben, die nicht direkt ersichtlich sind.

Ein Beispiel: Ein Algorithmus erkennt, dass es sich bei einem Bild um eine Feier handelt. Aber es ist ihm nicht unmittelbar klar, dass es sich um Onkel Hansens Geburtstag handelt – es sei denn, es hängt irgendwo ein Banner mit der Aufschrift: «Onkel Hans, alles Gute zu deinem 65.»

Auch den Symbolgehalt bei Symbolfotos wird man sicherlich benennen wollen. Fünf Leute, die sich anlachen und die Arme um die Schultern gelegt haben, könnten Freundschaft oder Zusammenhalt signalisieren. Das wird man in den Stichworten festhalten wollen. Ebenso, die persönliche, private Bedeutung, die ein Bild haben könnte.

Bildanalyse ohne Cloud

Eine Frage bleibt: Kann man seine Fotos auch ohne Cloud verschlagworten? Denn gerade die inhaltliche Analyse von persönlichen und privaten Bildern lässt so wenig Fragen offen, dass man enorm viel Informationen über sich selbst an den Betreiber preisgibt. Meine persönliche Haltung ist, dass mir nicht wohl dabei ist. Ich nutze Google Fotos nur selektiv mit Bildern, die ich eh als öffentlich betrachte.

Eine Lösung, die genau das verspricht, ist Excire: Sie hält auf die Frage, ob die Fotos in der Cloud landen, kurz und bündig fest:

Nein. Datenschutz ist uns wichtig, daher analysiert unsere KI Ihre Fotos auf Ihrem Rechner. Wir verzichten auf den Einsatz einer Cloud-Lösung.

Die Software hat darüber hinaus genau die Funktionen, die man als anspruchsvoller Hobbyfotograf oder als Profi erwartet: Die automatisch generierten Metadaten stecken nicht nur in der Datenbank der Software, sondern können in die Fotos bzw. in die XMP-Dateien geschrieben werden. Auf diese Weise bleiben die Daten erhalten, wenn man die Fotos weitergibt, irgendwo hochlädt oder in der Bildverwaltungssoftware eines Drittherstellers nutzt. Genauso muss es sein!

Ein Auto – oder doch ein Trabant? Auch das Brandenburger Tor – im Berlin der 1980er-Jahre fotografiert – wird nicht namentlich bestimmt.

Excire gibt es in zwei Varianten: Entweder als Plugin für Lightroom (Excire Search 2) oder als eigenständiges Programm (Excire Foto). Beide Varianten sind für Windows und Mac erhältlich und kosten je 69 Euro. Es gibt auch ein Bundle für beides für 99 Euro. Und man kann die Software während dreissig Tagen testen.

Die Analyse dauert

Sie hat eine aufgeräumte Oberfläche, die an das typische Layout einer Bildverwaltungssoftware oder eines RAW-Entwicklers angelehnt ist. Links gibt es eine Leiste für die Datenbank, Ordner und Sammlungen, in der Mitte ein Gitter mit Vorschaubildern und rechts die Möglichkeit, nach Fotos und Stichworten zu suchen.

Nach der Installation gibt man an, welche Ordner durchsucht werden sollen. Die Software geht die durch und führt die Analyse durch. Und da die auf dem Rechner passiert, muss man Excire erst einmal laufen lassen. Für meinen Datenbestand mit gut 33’000 Fotos hat die Analyse knapp fünf Stunden gedauert. Allerdings ist mein Windows-Rechner auch nicht mehr der jüngste. Es ist anzunehmen, dass das auf aktueller Hardware um einen Faktor schneller ginge.

Die Schlagworte lassen sich über die Suche nutzen, stehen aber auch in einem Verzeichnisbaum zur Verfügung. Hier aus dem Ast mit den fotografischen Kriterien die Bilder, die den Tag Symmetrie erhalten haben.

Bei 441 Bildern gab es einen Fehler. Sie hatten zu wenig Auflösung, um analysiert zu werden.

Die Verschlagwortung: Überzeugend, mit einigen Einwänden

Das Resultat der Arbeit kann sich sehen lassen: Excire vergibt viele Schlagworte und hält die wesentlichen Informationen fest, die einem unbeteiligten Beobachter auffallen würden. Ein Familienfoto, das vor einem Weizenfeld entstanden ist, hat 16 Schlagworte: Natur, Gesicht, Person, Drei Gesichter, Gruppe, Feld, Landwirtschaft, Frontansicht, Augen offen, Männlich, Erwachsener, Bart, Brille, Weiblich, Kind, Profilansicht.

Die Hauptperson auf diesem Bild wird detailliert beschrieben – allerdings bleibt unerkannt, dass es sich um eine Wachsfigur handelt, die auf dem Schild namentlich beschrieben ist.

Es gibt oft auch Meta-Informationen zum Bild, zum Beispiel dunkel oder ungesättigt. Nicht immer sind die Informationen vollständig. Bei einem Bild meiner Tochter, auf dem sie einen Lätsch (🇩🇪🇦🇹: Schnute) zieht, ist diese Stimmung nicht erfasst. Bei den Fotos meiner schwangeren Frau wird der Schwangerschaftsbauch unterschlagen. Er wäre ohne Zweifel die wesentliche Information des Bildes; aber es leuchtet ein, dass er auch heikel ist. Denn wenn man nicht weiss, dass eine Person schwanger ist, könnte man sie schliesslich auch einfach für dick halten.

Es gibt auch gelegentliche Fehler. So wird meine Tochter, allerdings im Babyalter, gelegentlich als männlich taxiert. Sosehr mich das als Vater stört, so klar ist es mir, wie schwierig es ist, bei kleinen Kindern das Geschlecht richtig zu erfassen. Ein wirklicher Bock schiesst Excire allerdings, wenn es die Hand eines Neugeborenen als Sushi und als Lebensmittel taxiert. Na gut, das zeigt, dass wir der KI noch ein bisschen was voraus haben.

Hey, das ist doch Marylin!

Was ferner auffällt, ist, dass vor allem das Hauptmotiv beschrieben wird, also in aller Regel die abgebildeten Personen. Die Umgebung wird weniger detailliert oder gar nicht beschrieben. Auch werden allfällige Texte im Bild nicht mittels OCR verschriftlicht – dabei wäre das eine grossartige Hilfe, um dem Inhalt auf die Spur zu kommen, wie mein Beispiel mit Marylin Monroe zeigt.

Excire kann anhand dieser Vorlage feststellen, ob es weitere Bilder von dieser Dame in meinem Bildbestand gibt.

Fazit: Wie nicht anders zu erwarten, sind die automatisch vergebenen Schlagwörter nur zu einem gewissen Grad deckungsgleich mit denen, die man selbst gesetzt hätte. Das kann gar nicht anders sein – hat aber vielleicht sogar den Vorteil, dass die Bilder neutraler beurteilt werden als man das selbst tun würde. Man kann natürlich nachbessern, wenn man die Zeit investieren möchte. Doch selbst wenn man es nicht tut, sind diese Excire-Schlagwörter auf alle Fälle um Welten besser als keine Schlagwörter.

Darüber hinaus kann man auch nach bestimmten Gesichtern bzw. Personen zu suchen, wenn man eine passende Vorlage auswählt und auf Finde Gesichter klickt. Es ist aber nicht möglich, Personen zu benennen – oder ich habe die entsprechende Funktion nicht gefunden. Ebenfalls nicht möglich ist es, in die Trainierung der KI einzugreifen und auf diese Weise die eigenen Vorstellungen an passende Stichwörter einzuführen. Das stört mich nicht – das wäre wiederum mit sehr viel Arbeit verbunden.

Mich hat die Software überzeugt, sodass ich sie mir für meine lokalen Datenbestände anschaffen werde.

Beitragsbild: Fehlen nur noch die Schlagworte (Inga Seliverstova, Pexels-Lizenz).

Autor: Matthias

Computerjournalist, Familienvater, Radiomensch und Podcaster, Nerd, Blogger und Skeptiker. Überzeugungstäter, was das Bloggen angeht – und Verfechter eines freien, offenen Internets, in dem nicht alle interessanten Inhalte in den Datensilos von ein paar grossen Internetkonzernen verschwinden. Wenn euch das Blog hier gefällt, dürft ihr mir gerne ein Bier oder einen Tee spendieren: paypal.me/schuessler

Ein Gedanke zu „Wie man Fotos ohne Cloud verschlagwortet“

  1. Danke für den Tipp, sieht spannend aus! Habe bis zum Umstieg auf Luminar AI auch alles verschlagwortet im Lightroom. Habe dann gemerkt, dass es zu viel Aufwand für zu wenig Ertrag war. Nach „Katze“ suchen zu können ist praktisch, wenn man ein Foto-Geschenk erstellen will. Aber nach „Baum“ oder „Ente“ habe ich nie gesucht…

Kommentar verfassen