Die Text-zu-Bild-Generatoren haben in diesem Jahr einen gewaltigen Sprung nach vorn gemacht. In einem Beitrag über Image Creator und Dall-e 3 habe ich die Bilder-KI als hinreissend bezeichnet und auch den Begriff des «Kunstgenerators» im «Tagesanzeiger» verwendet.
Das hat Kritik hervorgerufen. Leser Felix B. schrieb:
Jedenfalls hat das Bild mit Intelligenz nicht viel zu tun. Unrealistisch sind die Gebäude (gibt es an der Bahnhofstrasse nicht) und das Tram (Kein Tram hat vorn in der Mitte eine Fenstersprosse und das weisse Licht zeigt an, dass es auf der falschen Strassenseite fährt). Für den Sprung von unrealistisch zu phantastisch wäre eine grössere Portion Intelligenz oder KI nötig.
Felix bezieht sich auf das Bild, das ich zur Illustration verwendet habe und das die Bahnhofstrasse in Zürich in eine Dschungellandschaft mit Affen verwandeln sollte.
Dumme Fehler, dumme KI?
Aber was kritisiert Felix genau? Er stellt die Intelligenz in Abrede, weil die KI einige Fehler gemacht hat. Aber das funktioniert als Argument nicht: Es ist eine Binsenwahrheit, dass wir Menschen, die wir uns selbst für intelligent halten, ebenfalls andauernd Fehler machen – so oft, dass das geflügelte Wort existiert, irren sei menschlich.
Das Fehler-Argument geht noch aus einem weiteren Grund ins Leere: Es geht um einen Bereich, bei dem keine absoluten Wahrheiten gefragt sind. Die Aufgabe lautete, eine imaginäre Szene im Bild im Fantasy-Stil zu produzieren. Zwar sollte das Bild mit der Bahnhofstrasse und dem Tram auch eine reale Komponente haben. Aber wie gross die ist und wie exakt die mit der Wirklichkeit übereinstimmen, hat niemand festgelegt. Und keiner käme auf die Idee, einen menschlichen Künstler dafür zu kritisieren, der bei so einem Auftrag ein Gebäude zeichnet, das an der Bahnhofstrasse stehen könnte, aber nicht tatsächlich auch dort steht.
Keine ausreichende künstlerische Flughöhe?
Es ist daher genau andersherum, als Felix postuliert: Wenn die KI sich künstlerische Freiheiten nimmt, dann spricht das eher für ihren Kunstverstand als dagegen. Denn klassische, «nicht-intelligente» Computerprogramme zeichnen sich dadurch aus, dass sie kein Jota von der Programmierung abweichen. Bei diesem Ansatz müsste der Programmierer Vorlagen fürs Tram, das Gebäude und all die restlichen Bildparameter liefern und es käme genau das heraus, was wir erwartet haben.
Felix scheint das zu ahnen, darum sagt er, das Bild sei nicht «fantastisch» genug – also mit anderen Worten keine Kunst.
«Keine Kunst» ist wiederum ist ein Vorwurf, der auch auf Twitter geäussert wurde:
Wieso immer gleich von Kunst sprechen, wenn ein Bildgenerator ein Bild mittels KI generiert? @MrClickohttps://t.co/atvIcOTiwl pic.twitter.com/d6rdgyflph
— Jürg Kobel (@juergkobel) October 18, 2023
Es war klar, dass uns diese Diskussion nicht erspart bleiben würde – genauso wenig wie die Intelligenzdebatte. Und als ob das nicht verwirrend genug wäre, wirft sie auch die Frage auf, ob man intelligent sein muss, um Kunst zu fabrizieren. Oder ob ein eindrückliches Kunstwerk die Intelligenz seines Schöpfers beweist.
Der gleiche Sachverhalt wie bei den Affen?
An dieser Stelle kommt mir ein Artikel aus dem «Spiegel» vom 16. Juli 1963 gelegen, in dem es um die Affenmalerei geht:
In seiner «Biology of Art» kam Affentester Morris zu der Erkenntnis: «Heute haben der letzte Affe und der moderne Mensch das gleiche Interesse an der Herstellung von Bildern, man könnte sogar behaupten: Wenn ein zeitgenössischer Künstler ein Bild malt, hat er dafür kaum wesentlichere Gründe als ein Schimpanse.»
Die Affen malen aus Spieltrieb und aus Neugierde. Und das bringt uns zum Schluss, dass wir gut daran tun, Kunst nicht anhand des Endresultats zu beurteilen. Denn da gehen die individuellen Vorstellungen so weit auseinander, dass wir es gleich vergessen könnten, einen anerkannten Kunstbegriff herauszuarbeiten. Wenn wir aber die Intention zugrundelegen, dann haben Affen und zeitgenössische Künstler gleichermassen einen künstlerischen Impetus.
Die KI dagegen hat den nicht. Sie tut das, was man ihr sagt. Aber sie kommt nicht von sich aus auf den Gedanken, eine Idee gestalterisch umzusetzen. Das ist aber die zentrale Voraussetzung für künstlerisches Schaffen. Plakativ gesagt ist die Inspiration wichtiger als das, was am Schluss herauskommt.
Darum bin ich mit der Kritik einverstanden: Erstens ist die KI nicht intelligent. Mir wäre es lieber gewesen, wenn sich ein anderer Begriff durchgesetzt hätte. Aber der Begriff hat schon existiert, bevor es Dinge wie das maschinelle Lernen überhaupt gab, und er kam bei jeder sich bietenden Gelegenheit zur Anwendung. Darum war es wohl unvermeidlich, dass wir uns heute auf ihn eingeschossen haben.
Würde die KI es auch allein hinkriegen?
Zweitens macht die KI keine Kunst. Nach meinem Verständnis erfüllen viele der Bilder, die sich mit Dall-e 3, Midjourney oder Adobe Firefly erzeugen lassen, durchaus meine Anforderungen an Kunst – ich selbst würde sie allein auch mit allergrösster Anstrengung nicht so hinbekommen. Aber alles, was so entsteht, ist ein Gemeinschaftswerk von dem Menschen, der die Idee hatte und den Prompt formulierte und der Maschine, die sie anhand eines riesigen Datensatzes, der zu ihrem Training verwendet worden ist, zur Ausführung brachte.
Wie lange das so bleiben wird, ist offen. Auch heute schon können wir ChatGPT fragen, ob er uns einen Prompt für ein schönes Bild erstellen mag. Die sind zwar alles andere als originell und einen Schöpfungsdrang vermag ich in der Antwort auch nicht zu erkennen. Aber vielleicht lässt der sich ja schon bald ebenfalls simulieren …
Beitragsbild: Jeder ein Künstler? (Microsoft Image Creator zum Prompt «An ape, a robot and a man side by side in front of an easel, working on paintings each. In an fancy artistic setting and a hyperrealistic view»).