Neulich bin ich auf die Idee verfallen, meinen Arbeitsablauf beim Bloggen zu straffen. Es geht um das Bild, das einen Blogpost illustriert. Ich bringe es auf eine bestimmte Grösse¹ und konvertiere es ins platzsparende Webp-Format. Das müsste sich doch automatisch erledigen lassen, oder?
Der klassische Weg besteht darin, sich ein Bildbearbeitungsprogramm mit Automatisierungsfunktionen zu besorgen. Die Möglichkeit, Abläufe per Klick zu reproduzieren, war für professionelle Bildbearbeitungsprogramme über Jahre ein wesentliches Kriterium. Und sie ist bis heute wichtig: Photoshop hält mit den Aktionen und den Scripts sogar zwei Möglichkeiten zur Rationalisierung bereit.
Doch im Jahr 2024 ist das nicht mehr der Weisheit letzter Schluss: Schliesslich haben wir die künstliche Intelligenz: Soll die uns doch eine massgefertigte Lösung schneidern!
Das war die Vorgabe für dieses Experiment: Ich will kein Programm wie Photoshop starten müssen. Denn auch wenn der Job automatisch erledigt wird, muss ich dennoch warten, bis der Start vollzogen ist, was bei den dicken Anwendungen dauert. Dann muss ich das Bild laden und die Aktion starten – was in einer minimalen Zeitersparnis resultiert.
Nein, es soll direkter gehen: Ich klicke die Bilddatei im Windows Explorer mit der rechten Maustaste an und wähle die Aktion, die zu erledigen ist. Und eine Sekunde später erscheint die bearbeitete Bilddatei auf meinem Desktop. Mir bleibt dann nur noch, die Bilddatei im Blogpost zu platzieren.
Dafür braucht es mehrere Dinge:
- Ein Bildbearbeitungsprogramm, das sich fernsteuern lässt.
- Ein Script, das das Programm fernsteuert.
- Und die Möglichkeit, dieses Script unkompliziert über das Kontextmenü des Windows-Explorers auszuführen. Wie das geht, erläutert der Beitrag Dem Windows-Explorer unseren Willen aufzwingen.
Nachfolgend erläutere ich die ersten beiden Punkte.
Das Programm ist schnell gefunden: Es handelt sich um Irfan View: Das ist ein Mittelding zwischen Bildbetrachter und Bildbearbeitungsprogramm, leistungsfähig und flexibel. Und es lässt sich per Befehlszeile steuern und damit auch in Scripte einbinden, die auf Ebene des Betriebssystems ausgeführt werden.
Der Nachteil bisher war, dass diese Scripting-Möglichkeiten schlecht bis gar nicht dokumentiert sind. Doch an dem Punkt kommt dieser Tage die KI ins Spiel. Ich habe mein Experiment nicht nur mit ChatGPT, sondern auch mit Claude unternommen. Schliesslich ist das eine hervorragende Gelegenheit auszuprobieren, welches der beiden Sprachmodelle für Belange der Automatisierung die bessere Lösung anbietet.
Das ist, nicht völlig überraschend, Claude. Aber im Detail:
- Das Batch-Script von ChatGPT² erfüllt den Zweck – ausser, wenn die Dateinamen Leerzeichen enthalten. Was bei mir immer der Fall ist, da ich meinen Bildern eine per Leerzeichen abgetrennte Datierung voranstelle.
- Claude liefert ein Script³, das auf Anhieb fast perfekt funktioniert. Eine Kleinigkeit musste ich nachbessern.
Uns fällt auf, dass Claude verdienstvollerweise sogar abfragt, ob IrfanView installiert ist, dabei die 32- und die 64-Bit-Version berücksichtigt und bei Abwesenheit des Programms eine Fehlermeldung anzeigt. Die Nachbesserung erfolgte in Form des Parameters /aspectratio
, den ich beim Aufruf von IrfanView von Hand ergänzen musste: Ohne den wird das Bild nicht mit dem Original-Seitenverhältnis skaliert, was natürlich nicht im Sinn des Erfinders ist. Die Zeile lautet dann wie folgt:
"%IRFANVIEW%" "%INPUT_IMAGE%" /resize_long=1200 /aspectratio /convert="%OUTPUT_PATH%"
Und ich habe Output-Namen abgeändert, da ich den Zusatz resized nicht benötige ("OUTPUT_NAME=%~n1.webp"
).
Fazit: Jeder ein Programmierer dank künstlicher Intelligenz? Die Frage habe ich im Februar schon einmal gestellt; und damals mit einem «Nein, aber …» beantwortet: Die Sprachmodelle nehmen uns 99 Prozent der Arbeit ab. Aber das letzte eine Prozent lässt sich nicht erbringen, wenn wir nicht selbst ein grundlegendes Verständnis mitbringen, was wir tun und worauf es bei solchen Automatisierungsaufgaben ankommt.
Trotzdem: Dieses Beispiel zeigt das riesige Potenzial der KI auch bei alltäglichen Arbeisabläufen. Und nebenbei ist bewiesen, dass ChatGPT nicht das Mass aller Dinge ist …
Fussnoten
1) Das lässt sich natürlich auch in WordPress durch ein Plug-in erledigen, zum Beispiel durch das hier vorgestellte Resize Image After Upload. Aber vielleicht wollen wir die Menge an Erweiterungen reduzieren und uns die Option offen halten, auch mal ein Bild in grösser hochzuladen? ↩
2) Das ist das Originalscript von ChatGPT:
@echo off set "input_file=%~1" set "output_file=%USERPROFILE%\Desktop\%~n1_converted.webp" rem Prüfen, ob eine Eingabedatei angegeben wurde if "%input_file%"=="" ( echo Bitte geben Sie eine Bilddatei als Parameter an. exit /b ) rem IrfanView-Befehl zum Skalieren und Konvertieren i_view64.exe "%input_file%" /resize_long=3000 /convert="%output_file%" /webpq=80 echo Das Bild wurde erfolgreich auf dem Desktop als WebP-Datei gespeichert: %output_file%
3) Das ist das Originalscript von Claude:
@echo off setlocal enabledelayedexpansion REM Prüfe, ob ein Parameter übergeben wurde if "%~1"=="" ( echo Bitte geben Sie ein Bild als Parameter an. echo Beispiel: %~nx0 "C:\Pfad\zum\Bild.jpg" exit /b 1 ) REM Setze Pfade set "INPUT_IMAGE=%~1" set "OUTPUT_NAME=%~n1_resized.webp" set "DESKTOP_PATH=%USERPROFILE%\Desktop" set "OUTPUT_PATH=%DESKTOP_PATH%\%OUTPUT_NAME%" REM Prüfe, ob IrfanView installiert ist if not exist "C:\Program Files\IrfanView\i_view64.exe" ( if not exist "C:\Program Files (x86)\IrfanView\i_view32.exe" ( echo IrfanView wurde nicht gefunden. Bitte installieren Sie IrfanView. exit /b 1 ) else ( set "IRFANVIEW=C:\Program Files (x86)\IrfanView\i_view32.exe" ) ) else ( set "IRFANVIEW=C:\Program Files\IrfanView\i_view64.exe" ) REM Führe IrfanView mit den gewünschten Parametern aus "%IRFANVIEW%" "%INPUT_IMAGE%" /resize_long=3000 /convert="%OUTPUT_PATH%" if errorlevel 1 ( echo Ein Fehler ist aufgetreten. exit /b 1 ) else ( echo Bild wurde erfolgreich konvertiert und auf dem Desktop gespeichert: %OUTPUT_NAME% ) exit /b 0
Beitragsbild: So sieht ein Sieger aus. PS: Und natürlich wurde dieses Bild hier mit dem vorgestellten Script behandelt (Rock’n Roll Monkey, Unsplash-Lizenz).
Ich habe in den letzten Wochen für alle möglichen Belange (Texte verbessern, C++ Code etc.) viel mit KI gearbeitet und immer ChatGPT, Gemini und Claude verglichen. In ALLEN meinen Bereichen war Claude am besten.