Da Vinci würde sich (vermutlich) im Grab umdrehen

Leonardo.ai im Test: Ein Web-Front­end für Stable Dif­fusion, das keine Wünsche offen lässt und auch Bild­bear­bei­tung mit KI-Unter­stützung ermög­licht.

Natürlich ist der Name eine fürchterliche Anmassung. Leonardo! Denn gemeint ist weniger DiCaprio als vielmehr da Vinci; das grösste Universalgenie aller Zeiten. Also, wer sich erdreistet, seine KI so zu nennen, hat (natürlich nur im übertragenen Sinn) einen Nasenstüber verdient.

Was mich angeht, ist der Name kein Hinderungsgrund für einen Test, sondern vielmehr eine Ermutigung. Aber natürlich mit maximalen Erwartungen. Also, kann die KI, die mit diesem Namen Bilder generiert, ihre Genialität unter Beweis stellen?

Leonardo.ai beherrscht die klassische Funktion einer generativen KI und erzeugt anhand eines Prompts Bilder. Für Vergleichszwecke¹ habe ich sie ein Bild des Android erzeugen lassen, das von einem elektrischen Schaf träumt. Das Resultat ist ein absoluter Reinfall: Anstelle des Androiden erscheint ein träumender Mensch, das Schaf ist eine Missgeburt mit einem Kopf an jedem Körperende und der Vorgang des Träumens ist ebenfalls nicht ersichtlich.

Der Android ist kein Android und das Schaf eine Missbildung.

An dieser Stelle ist eine Ergänzung wichtig: Leonardo basiert auf Stable Diffusion, dem freien KI-Bildgenerator. Entsprechend wird das Resultat massgeblich vom Modell beeinflusst, das wir auswählen. Standardmässig ist Leonardo Lightning XL eingestellt. Wir dürfen aber aus mehreren Dutzend Modellen wählen. Nebst den Standard-Modellen für Stable Diffusion (SDXL, Stable Diffusion 2.1, etc.) stehen auch diverse Community-Modelle zur Auswahl.

Stable Diffusion zum Prompt: Marianne, die Nationalfigur der Französischen Republik, vom berühmten Bild, auf dem sie mit blankem Oberkörper und wehender Fahne, siegreich auf dem Schlachtfeld steht, aber übertragen in ein modernes Umfeld, in dem sie als Superheldin auftritt.

Die Parameter machen den Unterschied

Ein Vorteil von Stable Diffusion gegenüber den meisten anderen Bildgeneratoren sind die diversen Einstellungsmöglichkeiten: Wir dürfen nicht nur die Abmessungen des Resultates (Bildbreite, -höhe und Seitenverhältnis) angeben, sondern auch diverse Optionen setzen. Unter anderem die folgenden:

  • Transparency macht bei Bedarf den Hintergrund durchscheinend, sodass das Bild auf andere Motive gesetzt oder in ein Druck- oder Weblayout integriert werden kann.
  • Photoreal erzeugt (im Idealfall) besonders realistische Ergebnisse.
  • Tiling ist gefragt, wenn das Motiv als Kachel verwendet werden soll, d.h. horizontal und vertikal ohne sichtbare Kante wiederholt werden muss.

Der klassische Bildgenerator nicht das einzige Werkzeug in Leonardos Zauberkasten. Es gibt diverse weitere Module, nämlich:

  • Mit Motion versehen wir ein Standbild mit etwas Bewegung. Das kennen wir von Webanwendungen wie Runwayml.
  • Bei Realtime Canvas fertigen wir eine Skizze an, die in Echtzeit, also quasi bei jedem Strich, in eine detaillierte Illustration umgewandelt wird. Die Resultate sind durchwachsen.
  • Bei Realtime Gen entstehen Bilder, während wir tippen – und zwar so schnell, dass annähernd bei jedem Buchstaben ein neues Motiv erscheint. Das ist nicht wirklich nützlich, aber sehr eindrücklich.
  • AI Canvas ist ein Bildbearbeitungsprogramm, das mithilfe von künstlicher Intelligenz vorhandene Bilder verändert. Wir können Bildteile ansetzen (Outpainting) und Bestandteile des Bildes löschen und ändern (Inpainting).
  • Im Bereich Advanced gibt es die Möglichkeit, eigene Modelle zu trainieren (Training & Datasets) oder Community-Modelle zu inspizieren und zu vergleichen (Finetuned Models).
Das sollte ein Hund sein! Bei der Real Time Canvas wird eine Skizze in Echtzeit in eine Illustration verwandelt.

Ein guter Weg, um Stable Diffusion zu nutzen

Fazit: Leonardo.ai hält nicht nur die klassische Bilderzeugung bereit, sondern vielfältige kreative Möglichkeiten – ähnlich wie Adobe Firefly, nur weniger auf deren Produktpalette zugeschnitten. Leonardo ist auch ein guter Weg, um Stable Diffusion einzusetzen, wenn wir die Software nicht selbst betreiben möchten. Wie wir letzteres tun könnten, habe ich erst kürzlich erklärt.

Leonardo lässt sich kostenlos mit 150 Gratis-Token pro Tag verwenden, wobei ein Bild ein oder zwei Dutzend Tokens beanspruchen kann. Es gibt drei kostenpflichtige Preispläne, die bei zehn US-Dollar pro Monat beginnen und bei 48 US-Dollar monatlich enden. Für dieses Geld gibt es 60’000 Token für die schnelle Bilderzeugung und die Möglichkeit, eigene Modelle zu trainieren und vorzuhalten.

Beitragsbild: Okay, vielleicht wäre er auch begeistert von Leonardo.ai (Modell «Leonardo Photoreal»).

Kommentar verfassen