Letzte Woche hat Apple iOS 18.2 vom Stapel gelassen. Das Betriebssystem-Update fürs iPhone hält, wie seine Vorgänger, einige Apple-Intelligence-Gimmicks bereit – allen voran die Image-Playground-App, auf die ich sehr gespannt war.
Es handelt sich um eine App, in der sich per künstlicher Intelligenz Bilder erstellen lassen. Zwei Dinge zeichnen sie aus: Erstens geht es nicht um allgemeine Motive, sondern um leichtgewichtige Fantasiebilder von uns selbst und den Leuten, die wir häufiger fotografieren. Image Playground liefert keine fotorealistischen Resultate, sondern verfremdete Bildnisse. Zweitens werden die Fotos nicht auf fremden Servern gerechnet, sondern direkt auf dem Gerät.
Nach einem verspielten Wochenende darf ich mit einem Fazit aufwarten, das zur einen Hälfte aus einem dicken Lob und zur anderen Hälfte aus einer ebenso dicken Portion Kritik besteht. Lasst mich mit dem positiven Aspekt anfangen:
In der Benutzung ist Image Playground ungeschlagen – kein Vergleich mit Stable Diffusion, wo wir uns mit halsbrecherischen Prompts herumschlagen müssen.
Erster Schritt: eine Person in einen Avatar verwandeln
Die App führt uns nach dem Bauklötzchenprinzip an die Resultate heran. Als erstes wählen wir eine Person, die als KI-Avatar im Bild zu sehen sein soll. Image Playground stellt uns die Personen zur Auswahl, die in unserer Fotomediathek häufiger auftauchen und in der Fotos-App mit Namen erfasst sind.
Mein Eindruck ist, dass nur Personen zur Auswahl angeboten werden, die auf selbst gemachten Fotos abgebildet sind. Das wäre einleuchtend, weil diese Massnahme es erschweren würde, Fotos von Prominenten oder generell fremden Personen zu erstellen. Diese Hürde ist allerdings keinesfalls unüberwindbar. Ich habe es zwar auf den ersten Anlauf nicht geschafft, Roger Federer als Protagonist in Image Playground auszuwählen, obwohl ich eines seiner Porträts aus dem Netz in der Fotos-App mit einem Namen versehen habe. Auf einem Umweg hat es doch geklappt. Den Trick erkläre ich weiter unten.
Der Deepfake-Falle ausweichen
Es versteht sich von selbst, dass Apple keinesfalls möchte, dass mithilfe dieser neuen App Deepfakes erstellt werden, die anschliessend in den sozialen Medien für Aufruhr sorgen. Vielleicht hält die App aus dem gleichen Grund auch keine Option für fotorealistische Resultate bereit.
Ist die Person ausgewählt, erhalten wir den Avatar in Varianten vorgeführt, die sich teilweise deutlich unterscheiden. Es scheint so zu sein, dass Image Playground immer nur ein einziges Bild als Grundlage für die KI-Repräsentation heranzieht. Diese Methode unterscheidet sich deutlich von den «magischen Avataren», die im letzten Jahr für Furore sorgten: Die wurden jeweils anhand von mindestens einem Dutzend Fotos ermittelt (vermutlich als Low-Rank-/Lora-Modell).
Mit älteren Herrschaften hat es Apple nicht so
Die Qualität der Avatare ist daher höchstens mittelmässig. Und sie variiert sehr stark: Die KI-Repräsentanz meiner Tochter ist teilweise ganz in Ordnung und auch meine Frau wird verhältnismässig gut getroffen. Der Avatar meiner Mutter hat kaum Ähnlichkeit mit dem menschlichen Vorbild. Und auch mit meinen Avataren bin ich unzufrieden – auch wenn die Resultate nicht so verheerend sind wie bei Microsoft.
Haben wir den Avatar ausgewählt, beginnt die Inszenierung. Die App stellt uns Kostüme (Raumanzug, Chefmütze, Wandermontur mit Rucksack, Rennfahrerhelm, Superheldenanzug, Anzug mit Schlips), Accessoires (Malpalette, Beret, Schal, Sonnenbrille, Beanie-Mütze) und Szenerien (Stadt, Wüste, Wald, Berge, Leuchtturm, Park, Stadion, Bühne, Vulkan) zur Auswahl, die wir zu unserem Werk hinzufügen können.
Wir haben auch die Möglichkeit, über das Eingabefeld eine Beschreibung des Bildes abzugeben. Von komplizierten Prompts ist die App aber überfordert und sie verweigert die Erstellung gelegentlich auch mit einer Fehlermeldung. Was aber gut funktioniert, ist, Instruktionen als einzelne Stichworte hinzuzufügen. Während der Erstellung des Bildes schweben die einzelnen Stichworte um das in Entstehung begriffene Motiv herum und können auch wieder entfernt werden.
Sich an brauchbare Resultate herantasten
Da das Berechnen zügig vonstattengeht, lädt diese Methode zum Experimentieren ein: Nach dem Prinzip von Versuch und Irrtum lassen sich Stichworte hinzufügen oder entfernen. Da die App immer mehrere Varianten generiert und beim Scrollen nach links zweitere hinzufügt, tasten wir uns spielerisch ans gewünschte Motiv heran: Der Anspruch des Bilder-Spielplatzes erfüllt Image Playground viel besser als andere Apps wie Dall-e oder auch Adobe Firefly.
Jetzt bin ich euch noch den Tipp schuldig, wie ihr Roger Federer oder andere Leute in die App hineinbekommt: Dazu tippen wir rechts unten auf das Plus-Symbol. Es erscheint ein Pop-up-Menü, in dem wir den Stil auswählen (Animation oder Illustration). Ausserdem finden sich hier die beiden Befehle Choose Photo und Take Photo. Über ersteren findet das aus dem Web gespeicherte Foto seinen Weg in die App.
Wenn diese Bilder bloss nicht so kitschig wären!
Ich hatte nebst dem Lob aber auch Kritik in Aussicht gestellt. Und bei der sind wir jetzt – und damit bei der Stilkritik.
Diese Motive sind ein Ausbund an Kitsch. Mir ist klar, dass Apple aus den Kontroversen um die magischen Avatare die notwendigen Lehren gezogen hat. Die Apps, die Ende 2022 aufgetaucht sind, haben vor allem die Nutzerinnen oft auf sexualisierte Weise dargestellt. Und es ist generell ein Risiko, wenn die Nutzerinnen und Nutzer selbst zum Experimentierobjekt werden: Die KI kennt die persönlichen Sensibilitäten nicht und kann daher nicht verhindern, dass Leute auch in Situationen dargestellt werden, die ihnen nicht entsprechen, sie auch befremden oder im schlimmsten Fall schockieren und traumatisieren.
Es verleidet wahnsinnig schnell
Um das zu verhindern, verwendet Apple einen so harmlosen Stil, wie man sich ihn nur ausdenken kann. Animation erinnert an animierte Kinofilme wie The Incredibles, Illustration an Zeichnungen in Kinder- und Schulbüchern. Aber das macht die Sache leider auch unglaublich vorhersehbar. Wir werden in maximal stereotype Versionen unserer selbst verwandelt. Man kriegt nicht einmal ein Bildchen hin, auf dem man nicht fröhlich grinst.
Darum lässt der Reiz des Bilder-Spielplatzes nach ein paar ersten Versuchen sofort nach. Es bräuchte zumindest einige Stilvarianten mehr, damit auf Dauer auch die Erwachsenen ihren Spass haben.
Abschliessend ein kurzes Fazit zu Apple Intelligence und zu den KI-Plänen von Apple, wie sie sich per Ende 2024 präsentieren. Während der Start Ende Oktober mehr als enttäuschend war, wird die Strategie langsam deutlich. Ich finde den Ansatz ausgezeichnet, die Berechnungen standardmässig lokal durchzuführen. Ich rechne es Apple an, dass auf diese Weise dem Datenschutz Rechnung getragen wird. Der Konkurrenz, Microsoft, aber auch Google, scheint dieser Aspekt weitestgehend egal zu sein. Apple zeigt gleichzeitig, welches Potenzial in KI-Apps steckt, die ins Betriebssystem integriert sind und direkt mit den Daten von uns Nutzerinnen und Nutzern arbeiten können. Da können wir uns für 2025 noch auf einiges gefasst machen.