Neulich habe ich Adobe Firefly einem ausführlichen Test unterzogen. Diese Software verwandelt kurze Textbeschreibungen in Bilder und stellt sich in einer Reihe mit Dall-e 2, Midjourney und Stable Diffusion.
Der wesentliche Unterschied zur Konkurrenz besteht allerdings darin, dass die Text-zu-Bild-Erzeugung nur eine von vielen Anwendungsmöglichkeiten ist. Firefly soll künftig ein knappes Dutzend weiterer Funktionen bereithalten. Nicht alle können bereits getestet werden. Aber es gibt eine, die bereits zur Verfügung steht: Sie heisst Text effects und erlaubt es, einen Schriftzug mit einem Muster auszustatten, bzw. ihn wie eine Art typografisches Bildhauerobjekt aussehen zu lassen. Die Beispiele zeigen Buchstaben, die mit Fell bewachsen oder mit Federn geschmückt sind, die wie ein knorriges Stück Holz aussehen oder wie ein moosbewachsenes Schwemmteil. Oder wie ein Toast mit komischer Käsekruste oder ein beschupptes Stück Schrift.
Ein schöner Logo-Schriftzug für diese Site hier
Um diese Funktion zu testen, habe ich mir überlegt, ein typografisches Logo für meine Website zu erzeugen. Die Idee: Die Buchstaben sollten mit einem Mosaik aus bunten Plättchen überzogen sein, das an das namensgebende Spiel «Clickomania» erinnert: Dort gibt es bekanntlich ein Spielfeld, das mit quadratischen Steinen in unterschiedlichen Farben belegt ist, und die weggeklickt werden können, wenn mehrere Steine der gleichen Farbe eine Gruppe bilden.
Das soll sich im Schriftzug widerspiegeln: Buchstaben, die wie ein buntes, Clickomania-haftes Badezimmer gekachelt sind.
Also, erster Versuch:
Das sieht imposant aus und würde, in Handarbeit erstellt, zu einer massiven Plagerei ausarten. Aber es ist offensichtlich nicht einmal ansatzweise das, was ich mir ausgedacht habe. Die Plastikteile sind viel zu unregelmässig und unterschiedlich gross, um als Spielsteine durchzugehen. Und das Bewegungsmoment, das ich gern hier gesehen hätte, macht die Sache offensichtlich unnötig kompliziert.
Also, zweiter Versuch:
Ich hatte die Hoffnung, mehr Ruhe in die Anordnung der Teile bringen zu können, indem sie auf einem Schachbrett ausgelegt werden sollen. Das sollte doch unweigerlich zu einer rasterförmigen, gleichmässigen Darstellung führen, nicht? Denn ich möchte, dass das Spielfeld von «Clickomania» wiederzuerkennen ist, auf dem die quadratischen Spielsteine liegen.
Das ist zu organisch für meinen Zweck
Klar, damit das nicht allzu uniform und kästchenhaft aussieht, ist ein bisschen Varianz in Ordnung. Auch eine leichte dreidimensionale Wirkung könnte interessant sein. Aber das ist im Vergleich viel zu chaotisch und nicht als Spielfeld eines Computergames wiederzuerkennen.
Ausserdem stimmt die Farbgebung nicht. Im Spiel gibt es Steine, die farblich klar zu unterscheiden sind. Wie viele Farben es gibt, hängt vom Spielmodus ab, aber es sind drei bis maximal sechs.
Darum ein nächster Versuch mit einer hoffentlich eindeutigen Instruktion:
Das ist nicht schlecht, allerdings hat sich Firefly nicht an die Angabe gehalten, dass alle Steine gleich gross sein sollen. Sie sind auch nicht immer quadratisch, und die Unterschiede bei der Höhe sind zu stark. Ein Spielfeld – und meines Erachtens auch ein Mosaik – müsste einigermassen ebenerdig sein.
Klar; eine gewisse Abweichung von der Norm gäbe diesem Schriftzug eine natürliche, handgemachte Anmutung. Aber diese starken Abweichungen erinnern eher an eine Landschaft aus chaotisch aufgestapelten Legosteinen, denn an ein wohlgeordnetes Spielfeld.
Kritik am Rand: Die kleinen As sehen nicht aus wie As, sondern wie ein seitenverkehrtes S.
Darum ein vierter Versuch:
Hier versuchen wir es mit dem Hinweis aufs Computerspiel. Der fruchtet allerdings auch nicht. Die Spielsteine sind längst nicht immer quadratisch und auch nicht gleich ausgerichtet – was ich allerdings auch nicht gefordert habe. Das sieht interessant aus, ist aber genauso weit weg von meiner Idee wie der erste Versuch.
Wie wäre es mit Kugeln statt mit Kacheln?
Aber gut: Schliesslich gibt es «Clickomania» nicht nur in der klassischen Spielvariante mit den quadratischen Spielsteinen, sondern auch in einer Variante mit bunten Kugeln. Diese Kugeln habe ich seinerzeit eigenhändig von Corel Dream 3D rendern lassen. Sie erscheinen standardmässig, wenn «Clickomania Next Generation» gestartet wird (was übrigens auch unter Windows 11 nach wie vor funktioniert).
Darum ein letzter Versuch mit Kugeln anstelle der quadratischen Mosaiksteinchen. Denn Kugeln haben immerhin den Vorteil, dass sie nicht verdreht oder schräg angeordnet werden können.
Und siehe da:
Hundertprozentig zufrieden bin ich nicht, weil die Firefly einige meiner Anordnungen missachtet hat: Die Kugeln sind nicht gleich gross, sie sind nicht gleichmässig und nicht rasterförmig angeordnet. Und sie liegen auch nicht auf einer einzigen Fläche. Sie sind offensichtlich auch übereinander gestapelt. Aber trotzdem: Dieses Resultat will ich gelten lassen – auch wenn ich nicht sicher bin, ob ich es tatsächlich als Logo für diese Website hier verwenden werde.
Je abstrakter, desto schwieriger
Wir lernen: Bei dieser Aufgabe ist es entscheidend, unsere Vorstellung ganz exakt in Worte zu fassen. Und das ist alles andere als einfach, da bei solchen abstrakten Situationen selbst eine ganz einfache Szene eine grosse Zahl von impliziten Voraussetzungen beinhaltet. In dem Fall dürfte das Problem auch darin liegen, dass Adobe diese KI nicht mit Vorlagen trainiert hat, die mit meinen Ideen korrespondieren – ich wünsche mir einen technoiden Look, während die Erfinder von Firefly organische Vorbilder hatten.
Derlei Disrkmacht die Erzeugung solcher typografischer Objekte zu einer schwierigen und auch etwas frustrierenden Angelegenheit. Aber wir erkennen auch die Grenzen der KI; denn einem menschlichen Künstler hätten wir unser Anliegen sehr viel schneller verständlich gemacht.
Beitragsbild: Adobe Firefly mit dem Prompt «Equal-sized reflexive balls in the colors green, yellow, blue and red, arranged evenly».