In Windows tauchen an allen Ecken und Enden KI-Funktionen auf. In der Bildbearbeitung Paint habe ich sie bereits getestet und festgestellt, dass die künstliche Intelligenz dort keine hohe Kunst produziert. Heute geht es um die Windows-Fotoanzeige, denn auch die bleibt nicht von Microsofts KI-Euphorie verschont.
Im Bereich Generatives Löschen finden wir mit einen Radiergummi, mit dem wir unerwünschte Elemente aus dem Bild reagieren, worauf die KI die Lücke möglichst unauffällig schliesst. Ich finde die Resultate nicht überzeugend. Oben das Beispiel mit dem Motorrad, das ich mit dieser Funktion beseitigt habe. Bei einem schnellen Blick schaut es gut aus, doch bei näherem Hinsehen entdecken wir viele Unstimmigkeiten. Die Beschriftung auf dem Boden müsste «Bus» lauten. Das tut sie nicht. Und auch der Randstein sieht seltsam aus.
An dieser Stelle soll es schwerpunktmässig um das Bild umgestalten-Feature gehen. Die arbeitet nach dem Prinzip von Bild zu Bild (Image to image AI). Auf die Sinnfrage komme ich am Schluss. Zuerst sollen einige Tests zeigen, wie das funktionieren könnte:
1. Versuch: das Selfie
Als Erstes kommt das Selfie zum Zug, das ich schon für meinen Test mit Paint benutzt habe. Und genau wie bei jenem Test sind die Resultate niederschmetternd. Gleichgültig, was ich tue: Es kommt immer ein alter, hässlicher Mann dabei heraus.
Ich weiss nicht, mit welchem Material Microsoft dieses Modell trainiert hat und ob die Leute in Redmond es jemals ausprobiert haben. Aber wer zum Teufel würde sich per KI in einen schrumpeligen alten Sack mit Säufernase verwandeln wollen?
Natürlich habe ich das Experiment auch mit anderen Motiven durchgeführt, zum Beispiel mit meiner Tochter. Die Resultate werde ich hier nicht veröffentlichen, aber sie sind ähnlich verstörend. Sie wurde mal zur Asiatin (unerwartet, aber nicht per se schlimm) und mal zu einer mittelalterlichen Frau, immer ohne jeden Wiedererkennungswert und ohne kreativen Nutzen.
Zurück zur Versuchsreihe: Beide Bilder sind mit dem Stil Surrealismus entstanden. Beim ersten Bild (Mitte) habe ich nichts am Standard-Prompt für diesen Stil verändert. Beim zweiten habe ich die explizite Aufforderung ergänzt, den Mann «ansehnlich und jung» zu machen. Microsoft stellt auch die Stile Fantasie und Anime zur Verfügung. Bei denen sind die Resultate genauso haarsträubend.
Nun, meine Eitelkeit wäre weniger gekränkt, wenn die Bilder wenigstens in irgendeiner einer Hinsicht etwas hergeben würden. Aber was sollen diese seltsamen Wucherungen, die anstelle meiner Arme eingefügt wurden? Dabei gäbe der kahle Hintergrund eine Tummelwiese für interessante Experimente. Es gibt, wie in Paint, einen Regler Kreativität, den ich bei den beiden Beispielen in der Mitte belassen habe. Wenn wir herunterziehen, bleibt das Smartphone in der Hand erhalten, ebenso der linke Arm mit der Uhr. Wenn wir ihn deutlich höher ziehen, entstehen Motive, die keinen sichtbaren Bezug zum Original mehr haben.
2. Versuch: das Parktheater in Kempten
Aber gut, vielleicht kann die Software einfach keine Menschen? Ich habe mir darum einen etwas uninspirierten Schnappschuss aus meinen Ferien vorgenommen und von der Bild umgestalten-Funktion drei Varianten erzeugen lassen:
Ich wage die Behauptung, dass ihr, wenn ich euch nach den Stilvorgaben fragen würde, keine Ahnung hättet. Bei Fantasie rechts oben funkelt wenigstens der Himmel ein wenig und bei Cyberpunk links unten gibt es ein paar leuchtende Elemente. Aber das ist auch schon alles.
Abgesehen davon ist die Qualität schlecht: Es gibt Störungen im Bild, die nach hässlichen Kompressionsalgorithmen aussehen und selbst bei einem kleinen Abbildungsmassstab sichtbar bleiben.
3. Versuch: das «Gruppen»-Foto
An dieser Stelle war ich kurz davor, die Nerven zu verlieren und zum Urteil zu gelangen, dass Microsoft blanken Unsinn abgeliefert hat. Mit dem Mut des Verzweifelten habe einen dritten Versuch unternommen. Die App gibt uns auch die Möglichkeit, die Umgestaltung nur am Vordergrund oder aber am Hintergrund vornehmen zu lassen. Dafür gibt es ein Auswahlmenü, wobei die App Hintergrund und Vordergrund vollautomatisch separiert.
Das Bild rechts finde ich einigermassen in Ordnung. Falls der Hintergrund so anstössig gewesen wäre, dass wir ihn der Welt nicht zumuten könnten, wäre das eine Möglichkeit, die Aufnahme zu retten. Den Regler Kreativität habe ich in beiden Fällen relativ weit nach rechts gezogen.
Fazit: Eine grosse Enttäuschung
Trotz dieses letzten, nicht komplett verunglücken Experiments bleibt es dabei: Diese KI-Funktion ist so unausgegoren, dass sie fast keinen praktischen Nutzen hat. Einmal mehr zeigt sich, dass Microsoft im Bestreben, als KI-Pionier wahrgenommen zu werden, eine völlig unausgereifte Technologie auf die Nutzerschaft loslässt.
Nun könnte man sagen: Wenn es nichts nützt, schadet es auch nicht. Niemand muss die Funktion benutzen – und wenn jemand seine Bilder dennoch auf diese Weise selbst verschandelt, ist er selbst schuld.
Dem widerspreche ich: Die KI-Funktionen stehen nur Nutzerinnen und Nutzern eines Copilot+-PCs zur Verfügung. Die bewirbt Microsoft mit dem Versprechen, dass mit diesen Modellen ein «neues KI-Zeitalter beginnen» würde: Diese Features sollen Computer verkaufen und für Umsatz sorgen. Und unter diesen Umständen sollte schon etwas mehr herauskommen, als ein Selfie, auf dem man dreissig Jahre zu alt ausschaut – den Anschein von Alkohol-Abusus mal ganz ausgeklammert.
Und die Grundsatzfrage: Was soll das überhaupt?
Ich habe angedroht, dass ich mich auch über die Sinnfrage auslassen will. Ist diese Umgestalten-Funktion überhaupt eine gute Idee oder ein Auswuchs des Machbarkeitswahns?
Nüchtern betrachtet steht sie in der Tradition der Kunst- und Effektfilter. Die haben uns – Achtung, Ironie! – schon bei den klassischen Bildbearbeitungsprogrammen viel Freude bereitet. Die Idee: Wir verleihen einer langweiligen Aufnahme mit einer besonderen Optik mehr Pep. Kreativ eingesetzt, verstärkt das die Bildwirkung und begünstigt gewisse Assoziationen des Betrachters.
Mit der künstlichen Intelligenz kommt der Umstand hinzu, dass wir mit einer Textbeschreibung steuern, wie die Umgestaltung erfolgt. Das ursprüngliche Motiv wird zum Rohmaterial für eine neue Kreation: Wir erschaffen anhand eines echten Fotos eine Bildfiktion, nicht mehr nur eine Abwandlung.
Braucht es eine solche Funktion im Standard-Bildeditor eines Betriebssystems? Für eine fundierte Antwort müssten wir wissen, was die durchschnittlichen Nutzerinnen und Nutzer mit den Fotos auf ihrem Computer so anstellen. Ich weiss das leider nicht im Detail. Doch ich vermute, dass die meisten ihre Familienbilder ansehen und ein digitales Fotoalbum pflegen. Das hat einen eindeutig dokumentarischen Zweck. Natürlich dürfen die Bilder «schön» sein. Ich verstehe diesen Anspruch jedoch im fotografischen Sinn: Die Belichtung und den Zuschnitt eines Bildes zu korrigieren, finde ich in Ordnung. Aber möchte jemand Bilder in seinem Fotoalbum haben, die bloss noch einen vagen Bezug zur Realität haben?
Klar, zwei Einwände: Erstens muss, wie gesagt, keiner das Feature nutzen. Zweitens stecken die Leute ihre Bilder längst nicht mehr nur in die Fotoalben, sondern auch in die sozialen Medien. Und dort findet die Realität längst nicht mehr statt.
Das stimmt natürlich. Aber liegt das nicht daran, dass die Leute Dinge tun, weil alle anderen sie auch tun – und zwar unabhängig von der Sinnfrage?
Nun, im Fall von Microsofts KI-Funktion können wir uns beruhigt zurücklehnen. Solange nur so gruselige Resultate herausschauen, müssen wir keine Angst haben, dass die Leute mit derlei Machwerken die sozialen Netzwerke überfluten könnten.
Beitragsbild: Ein Selfie von meiner Tochter und mir, mit der Vorgabe, daraus eine Comiczeichnung im Stil von Asterix bzw. des Zeichners Albert Uderzo zu machen.
Wie sagt der neue Volksmund?
Kinder, Besoffene und KI sagen die Wahrheit …?
Beim Fazit gebe ich Dir 100% recht!
Aus Neugier wollte ich es mir anschauen, aber bei mir finde ich im Designer nur vorgefertigte Aktionen wie Restyle (Cubism, Pop art, …) und Background (Remove, Blur, …) 😑