Wer hätte das gedacht? Wir alle haben von Elon Musk ein verfrühtes Weihnachtsgeschenk erhalten. Er machte Mitte letzter Woche seine KI Grok 2 kostenlos allgemein zugänglich¹. Wobei, Korrektur: Diejenigen Personen, die seine Plattform, die uns noch unter dem Namen Twitter geläufig ist, den Rücken zugekehrt haben, kommen nicht in den Genuss dieser KI. Was uns an dieser Stelle zur Vermutung verleiten könnte, dass es sich hier um eine Massnahme handelt, den Nutzerschwund einzudämmen.
So steht eine Frage im Raum: Lohnt es sich denn, wegen Grok auszuharren? Die KI könnte ein Grund sein, zumindest sein Konto nicht zu löschen. Den Postings müssten wir uns in diesem Szenario schliesslich nicht mehr aussetzen.
Ein kleiner Test soll eine Klärung bringen: Für einen ersten Eindruck beschränke ich mich hier auf Grok als Bildgenerator. Was die Auskünfte angeht, die uns Grok erteilt, kämen wir nicht darum herum, deren politische und weltanschauliche Ausgewogenheit zu prüfen. Denn weil Twitter inzwischen so weit nach rechts lehnt, wollen wir natürlich wissen, ob auch das Grok-Sprachmodell von dieser Tendenz betroffen ist.
Darum habe ich Grok mit jenen Aufgaben konfrontiert, die ich hier im Blog den Bild- und Video-KIs routinemässig unterbreite. Das erlaubt es, die Resultate untereinander zu vergleichen: mit Firefly, Meta AI, Microsoft Image Creator, Leonardo.ai, diversen Video-Generatoren und den Bilder-KIs der ersten Stunde.
1) Die von elektrischen Schafen träumenden Roboter
Eine schwierige Aufgabe, weil mehrere abstrakte Elemente zu diesem Motiv beitragen: Die Elektrizität der Schafe und die Tatsache, dass sie bloss im Traum des Androiden vorkommen.
Es steht ausser Frage, dass Grok diese Aufgabe brillant löst. Die Bilder sind detailreich, stimmungsvoll und das Motiv ist problemlos erkennbar. Der Androide ist zwar mehr ein Roboter, aber das Mischwesen aus Mensch-Maschine hervorragend getroffen. Die Bestnote gibt es jedoch nicht, weil auch Grok Unstimmigkeiten fabriziert: Im ersten Bild scheint das Kissen in der Luft zu schweben. Beim zweiten steckt der Android mitten in der Bettdecke und beim dritten Resultat ist der Kopf des Androiden offenbar nicht mit dem Körper verbunden. Auch ist die Bauchlage etwas seltsam.
Übrigens: Im Fall dieses Tests hier, passt die Visualisierung eines Konzepts aus einem Science-Fiction-Romans besonders gut. Der Name Grok stammt nämlich aus dem Buch Stranger in a Strange Land («Fremder in einer fremden Welt») von Robert A. Heinlein.
2) Die Fuchs-Hasen-Frau
Auch das vier eindrückliche Resultate, die vor Augen führen, wie riesig die Fortschritte sind, seit ich diese Aufgabe im September 2022 zum ersten Mal gestellt habe. Wie die Ohren mit den Frisuren harmonieren, gefällt mir ausgezeichnet. Zu kritisieren ist, dass die Fuchs-Frau auf dem ersten Bild ein drittes, nach hinten zeigendes Ohr besitzt.
3) Das Matterhorn als Dessert
Warum ich seinerzeit auf die Idee gekommen bin, mir ein Schoko-Dessert in Form des Matterhorns erstellen zu lassen, habe ich nicht mehr erinnerlich. Es bleibt aber ein interessantes Motiv, weil es zeigt, wie streng sich die Modelle an die Vorgabe halten – und ob sie in der Lage sind, zwei so unterschiedliche Objekte wie einen Berg und ein süsses Gericht miteinander zu verschmelzen.
Groks Resultate sind denn auch durchwachsen: Bild Nummer zwei sieht mir verdächtig nach dem 💩-Emoji aus, aber immerhin ist im Hintergrund das echte Matterhorn zu erkennen. Die Varianten finde ich jedoch interessant, auch wenn beim ersten Bild Vanillecreme und beim dritten Puderzucker anstelle von Schlagrahm zum Zug kommt.
4) Zugabe 1: Die Punk-Familie in Paris
Unlängst habe ich ein weiteres kniffliges Motiv in meine Testreihe aufgenommen: die Punker-Familie in Paris. Die hat mich in Stable Diffusion vor fast unlösbare Probleme gestellt. Auch bei dieser wirklich schwierigen Aufgabestellung liefert Grok ein souveränes Resultat ab: Das erste Bild mit dem Eiffelturm als Silhouette gefällt mir ausgezeichnet. Beim zweiten Motiv ist der Papa zu wenig Punk, beim dritten überzeugen zwar die Eltern, doch es gibt ein Kind zuviel und dass Mama den Nachwuchs leicht zu würgen scheint, ist auch nicht angemessen. Beim vierten Bild ist die Mutter eher eine Schwester, was den Mann zum Bruder macht.
5) Zugabe 2: Elon auf dem Einhorn
Bemerkenswert ist, dass sich mit Grok auch Bilder von bekannten Personen generieren lassen. Das klappt sonst bei keinem der grossen Bildgeneratoren; eine Ausnahme ist lediglich Image Playground von Apple.
Elon ist vor allem auf dem vierten Bild gut zu erkennen und auch am Einhorn ist wenig auszusetzen. In der Kombination wollen Pferd, Mann und Hintergrund nicht so richtig zusammenpassen: Vor allem das erste Bild wirkt so, als hätte ein mittelmässig begabter Photoshopper eine Komposition aus Einzelelementen gebastelt. Das liegt daran, dass die Lichtverhältnisse nicht stimmen: Die Schatten fallen völlig falsch und die Lichtstimmung im Vordergrund passt überhaupt nicht zu der im Hintergrund.
Diese Kritik trifft in geringerem Mass auch auf die anderen Varianten zu. Generell ist auffallend, wie viele Bilder bei Grok einen Sonnenuntergang (vielleichg auch einen Sonnenaufgang) zeigen, obwohl Gegenlichtaufnahmen ihre besonderen Tücken haben.
Fazit: Das kann sich sehen lassen!
Egal, was wir von Twitter und Musk halten: Grok überzeugt. Ich gehe nicht so weit, den anderen Bildgeneratoren abzuschwören. Doch wenn Bedarf an schwierigen und exotischen Motive besteht, zählt Grok definitiv zu den Kandidaten, denen ich eine Chance geben werde.
Abschliessend noch ein Tipp: Auf die Aufforderung «Draw me» erzeugt Grok ein Bild, in dem man selbst einen Auftritt hat. Für die Darstellung der Person zieht die KI das Profilbild heran. Da das bei mir eine (seinerzeit handgefertigte) Strichzeichnung ist, entsteht in meinem Fall leider nur eine sehr entfernte Ähnlichkeit. Ein Problem, das sich durch ein anderes Profilfoto beheben oder entschärfen liesse.
Fazit: Ob das ein Grund ist, den Twitter-Account zumindest vorerst nicht zu löschen, bleibt selbstverständlich eine persönliche Entscheidung. Was mich angeht, behalte ich meinen Account ohnehin, damit ich auch weiterhin Tests wie diesen unternehmen kann. Es bleibt aber dabei, dass Twitter eigentlich eine Plattform für Kurznachrichten und keine KI-Anwendung ist. Und die Kritik an Twitter als soziales Medium schafft Grok natürlich nicht aus der Welt: Wer dagegen ein Zeichen setzen will, sollte seinen Account trotz Grok aus dem Verkehr ziehen.
Fussnoten
1) Die KI lässt sich nun kostenlos benutzen. Vorher brauchte es ein bezahltes Abo dafür. Wer für Premium und Premium Plus bezahlt, bekommt ein grösseres Kontingent für seine Kreationen. ↩