Eine grüne Wiese für KI-Spielkinder

Was für KIs werden im neuen Jahr auf die Mensch­heit los­gelas­sen? Und wo könnte man sich hin­wen­den, um selbst eine lustige, künstlich intel­li­gen­te An­wen­dung zu ent­wickeln? Eine Antwort auf beide Fragen findet sich (viel­leicht) auf huggingface.co.

Was wird das neue Jahr bringen? Natürlich ganz viele neue Anwendungen im Bereich der künstlichen Intelligenz. Ich warte auf Movie.AI: Ihr füttern wir ein Drehbuch, dann warten wir neunzig Sekunden, um uns dann den künstlich generierten Spielfilm anzusehen. Und falls wir kein Drehbuch haben, dann hilft uns Script.AI weiter: Wie der Name verrät, ist das ein Modell, das aus einem kurzen Exposé die Geschichte inklusive Regieanweisungen erzeugt.

Naja, das klingt noch etwas zu futuristisch: Bis wir so weit sind, müssen wir vermutlich noch bis 2025 warten. Was die unmittelbaren Möglichkeiten angeht, vermittelt uns huggingface.co einen Eindruck. Das ist die Website der «Community für maschinelles Lernen, die gemeinsam an Modellen, Datensätzen und Anwendungen arbeitet.» Wikipedia führt das noch ein bisschen genauer aus:

Hugging Face, Inc. ist ein französisch-amerikanisches Unternehmen mit Sitz in New York City, das Tools für die Entwicklung von Anwendungen für maschinelles Lernen entwickelt. Es ist für seine Transformers-Bibliothek bekannt, die für Anwendungen zur Verarbeitung natürlicher Sprache entwickelt wurde, sowie für seine Plattform, die es Nutzern ermöglicht, Machine-Learning-Modelle und -Datensätze zu teilen und ihre Arbeit zu präsentieren.

Ich bin Hugging Face begegnet, als ich nach einem Tool für die Erkennung von KI-generierten Bildern gesucht habe. Das gibt es hier, allerdings zeigt es seit ein paar Tagen bloss einen Ausführungsfehler (runtime error) an. Klar: Hugging Face ist als Experimentierfeld für KI-Spielkinder gedacht. Fehler zu produzieren, gehört dazu. Und ja, es juckt mich in den Fingern, selbst ein solches Experiment auf die Menschheit loszulassen. Ich fürchte allerdings, dass ich erst einmal drei Monate investieren müsste, um mir die Grundlagen anzueignen. Wir könnten aber ein vorhandenes Modul (genannt Space) duplizieren und versuchen, darauf aufzubauen.

Mit Röckchen und Brustpanzer

Da ich mir auch das nicht zutraue, begnüge ich mich erst einmal damit, mir die lustigsten Projekte anzusehen. Toll finde ich Outfit Anyone: Hier wählt man ein Model aus und lädt zwei Fotos hoch: Das erste zeigt ein Kleidungsstück für den Oberkörper, das zweite für die untere Körperhälfte.

Outfit Anyone zieht der Dame links die in der Mitte als Foto abgebildeten Kleidungsstücke über.

Die Aufgabe der KI ist es, das Model fotorealistisch zu bekleiden. Ich habe das mit dem Brustpanzer einer Ritterrüstung und einem roten Röckchen probiert – und siehe da, die KI hat sich davon nicht irritieren lassen.

Das ist ein lustiges Spielzeug. Aber Modemuffel wie ich stellen sich natürlich sofort die Möglichkeit vor, Kleider anprobieren zu können, ohne eine Umkleidekabine aufsuchen zu müssen.

Mona Lisa beim Joggen

Magic Animate ist ebenfalls eindrücklich: Wir wählen ein Standbild mit einer Person und eine Videosequenz, die eine Bewegungsabfolge zeigt, woraufhin die KI die abgebildete Person in Action versetzt. Eines der Beispielbilder zeigt Mona Lisa beim Joggen.

Playground V2 ist ein Bildgenerator wie Dall-e oder Midjourney, und in der AI Comic Factory geben wir einen Prompt ein und wählen das Panel-Layout einer Comic-Doppelseite, woraufhin wir umgehend die passende Geschichte erhalten.

Die meisten dieser Spaces dürfen wir ausprobieren. Es kann vorkommen, dass wir uns in Geduld üben müssen oder, wie beim KI-Bilder-Detektor, ein Fehler auftritt. Und klar, die Resultate sind nicht immer über alle Zweifel erhaben. Ich habe AI Comic Factory mit folgendem Prompt ausprobiert¹:

Heidi, das Schweizer Mädchen aus der berühmten Johanna-Spyri-Geschichte, lebt fröhlich in den Schweizer Alpen, als ein UFO auftaucht und sie, ihren Freund Geissenpeter und ihren Opa Alpöhi auf dieses UFO entführt. Die Aliens fliegen ins Weltall zu einem fremden Kuhplaneten. Dort herrscht Notstand, denn niemand von den Ausserirdischen weiss, wie man die Kühe versorgt. Also sollen die drei Schweizer den Ausserirdischen helfen, sich um die Kühe zu kümmern.

Wie man sieht, ist das Resultat unbrauchbar: Nebst dem Umstand, dass Geissenpeter auf der Strecke geblieben ist, fällt uns auf, dass es keine konsistente Darstellung der Figuren gibt, die KI nichts mit dem UFO und den Aliens anfangen kann und auch der Stil von Panel zu Panel variiert. Aber alles andere hätte mich auch gewundert.

Heidi und die Aliens: So ganz bringt AI Comic Factory diese Story nicht auf den Punkt.

Ähnliches gilt auch für Illusion Diffusion oder AI Tube: Mit dem ersten Modul erzeugen wir aus einem Prompt und einem Muster eine optische Illusion. Das zweite kreiert kurze Videos aus Prompts, die teils recht realistisch aussehen, aber, soweit ich sagen kann, keinerlei Sinn ergeben.

Also: Es geht nicht um Perfektion und um grossartige Resultate, sondern darum, ein Gespür für die Möglichkeiten und Grenzen zu bekommen. Die sagenhafte Zahl von 435’188 Modellen können gesucht, inspiziert und heruntergeladen werden.

Und natürlich darum, sich Prompts einfallen zu lassen, die eine KI in komplette Verwirrung stürzen.

Hugging Face hält auch LLMs (grosse Sprachmodelle) bereit, die wir lokal auf unserer eigenen Hardware betreiben. Mehr dazu in diesem Beitrag.

Fussnoten

1) Es gibt auch die Möglichkeit, einen Character-Prompt zu verfassen. Hier habe ich Folgendes geschrieben:

  1. Alp Öhi, an old Swiss man living in the Alps
  2. Heidi, his granddaughter, living with him. She is a girl aged 10.
  3. Peter is Heidis friend, an eleven year old boy.
  4. The chief alien from a foreign planet, arriving with the UFO. He is a green insect like creature.
  5. Three underlings of the alien chief, looking similar like the boss, but much smaller.
  6. The cow chief on the home planet of the aliens, where they arive with Alp Öhi, Peter and Heidi.

Kommentar verfassen