Die KI hat neuerdings auch Musikgeschmack

Audioatlas ist eine Such­ma­schi­ne, die uns für Video­projek­te passende Songs für die musi­ka­li­sche Unter­ma­lung vor­schlägt. Ich habe die Probe aufs Exem­pel gemacht – natür­lich nicht ohne der KI Fallen zu stel­len.

Stellen wir uns vor, wir seien Produzent eines Spielfilms: Wie finden wir ein Stück Musik, das zu dieser oder jener Szene passt? Klar, im Idealfall gibt das Budget einen Filmkomponisten her, der den Streifen mit einem Score ausstattet, der nicht nur auf die Szene Bezug nimmt, sondern die Handlung von Sekunde zu Sekunde begleitet.

Falls dieses Szenario nicht reine Fantasie ist, dann müssen wir mutmasslich kleinere Brötchen backen: Wahrscheinlich sind wir sogar in der Situation, dass wir uns mit Musik eindecken müssen, die wir gratis verwenden dürfen – indem wir das Internet als Soundfundgrube verwenden. Aber malen wir uns aus, das sei nicht der Fall und wir könnten beliebige Titel für unser Projekt lizenzieren. Wie finden wir dann passende Lieder?

Klar, wir fragen den Drehbuchautor: Der hat vielleicht Ideen – oder sogar konkrete Vorschläge. Vielleicht ist es sogar so, dass er an bestimmte Songs gedacht hat, während er eine Szene schrieb. Oder die Inspiration für den ganzen Film war eine Wiedergabeliste von Spotify. In dem Fall ist unsere Arbeit einfach. Zumindest, solange die Rechte für die Titel auch für den Film verfüg- und bezahlbar sind.

Falls wir auf uns selbst gestellt sind, gibt es ein technisches Hilfsmittel. Das heisst audioatlas.com. Es sei, so verrät der Untertitel, die erste natürlichsprachliche Musiksuchmaschine der Welt: Wir geben eine Beschreibung ein – das Beispiel lautet «Ein Drohnenvideo des Kilimandscharo bei Sonnenaufgang» – und erhalten passende Vorschläge.

Diese Suchmaschine will natürlich sofort ausprobiert werden.

Der liebeskranke Hipster

Der rasierende Hipster.

Ein Hipster mit Herzschmerz, der seinen Bart abrasiert, weil er einen neuen Lebensabschnitt anfangen will.

Erster Vorschlag: First Day of my Life von Bright Eyes. Passt für mich recht gut: Etwas melancholisch, aber mit einem optimistischen Unterton. Und im Titel schwingt der Aufbruch mit. Allerdings fehlt der Liebeskummer – wenn der Hispster schwer darunter leidet, ist der Song unpassend.

Zweiter Vorschlag: Cat Power mit The Greatest. Das Stück trifft die Stimmung, wie ich mir sie vorstelle, besser. Der Herzschmerz ist greifbar, aber wie steht es um das Gefühl des Loslassens? Das könnte noch ein μ prägnanter sein. Die Hauptfrage ist jedoch: Ist eine Frauenstimme an dieser Stelle akzeptabel? Meines Erachtens ja, aber vielleicht würde man lieber ein Stimme haben wollen, die den inneren Monolog des Protagonisten reflektiert?

Drittens: Death Cab for Cutie, I Will Follow You Into the Dark. Ein schönes Stück, das aber von unauflöslicher Treue handelt und von Tod oder vielleicht auch Depression. Das lässt sich nicht mit der Aufgabenstellung vereinbaren.

Wir fragen uns natürlich, wie die Suchmaschine ihre Treffer liefert: Analysiert sie den Text? Liegen ihr die Noten vor oder kann sie die Audiodateien untersuchen? Ich habe dazu keine schlüssigen Informationen gefunden. Darum: Stellen wir Audio-Atlas eine Falle!

Das Training des Boxers

Der trainierende Boxer.

Ein Boxer, der eine grosse Chance bekommen hat, trainiert für einen wichtigen Kampf. Die Szene zeigt ihn, wie er rennend und mit Boxbewegungen durch die Strassen rennt, wie er Holz hackt, Seil springt, Klimmzüge und Rumpfbeugen und macht.

Ganz klar: Für diese Beschreibung muss zwingend Eye of the Tiger von Survivor zurückgeliefert werden.

Und tatsächlich: «Eye of the Tiger» ist in der Liste zu finden. Allerdings nicht auf der ersten Stelle, sondern an Position acht. Auf Platz eins findet sich Runaway von Linkin Park, auf Platz zwei Changes von 2Pac und auf Platz drei Party Up von DMX.

Auch Linkin Park funktioniert von der Energie des Songs her gut, aber der Refrain disqualifiziert den Song komplett: «I wanna run away, never say goodbye» – das funktioniert nicht für einen Sportler, der dem grossen Kampf entgegenfiebert. 2Pac ist ein Komplett-Ausfall; das Stück passt weder textlich noch musikalisch. DMX ginge, wenn man die Szene wie ein Musikvideo mit kurzen Schnitten inszeniert. Aber eine gute Empfehlung ist das auch nicht.

Wir lernen: Es lohnt sich, bei der Liste von Audioatlas nicht bloss die ersten drei Treffer anzusehen, sondern die ganze Liste.

Heidi

Heidi und Geissenpeter.

Ein Mädchen in den Schweizer Bergen, das bei Sonnenaufgang aus einer Holzhütte tritt. Sie winkt ihrem Grossvater zu, der vor der Hütte sitzt. Sie sieht einen Jungen, der mit einer Herde Ziegen daherkommt und rennt auf ihn zu.

Natürlich noch eine Falle. Es liegt auf der Hand, dass diese Szene instrumental untermalt werden müsste. Eine volkstümliche Weise wäre angebracht und falls gejodelt würde, würden wir dafür ein gewisses Verständnis aufbringen.

Audioatlas schlägt Keep Your Head Up von Ben Howard, Casimir Pulaski Day von Sufjan Stevens und New Slang von The Shins vor. Wir müssen nicht diskutieren, dass diese Titel allesamt durchfallen, weil ein moderner, urbaner, englisch gesungener Popsong für eine Geschichte aus dem 19. Jahrhundert von vornherein nicht geeignet ist.

Wenn wir Audioatlas zugutehalten, dass die KI Heidi nicht kennt und wir ihr nicht verübeln können, dass sie diese Anspielung nicht verstanden hat, dann sind die Empfehlungen nicht wesentlich besser: Es sind alles «erwachsene» Songs, aber die Beschreibung macht klar, dass die Hauptfiguren Kinder sind. Selbst für eine Inszenierung, die die Geschichte in die heutige Zeit versetzt, würden wir Lieder hören wollen, durch die sich Kinder angesprochen fühlen. Das ist nicht der Fall. Darum bleibt uns nichts anderes übrig, als bei diesem dritten Test ein Komplettversagen zu konstatieren.

Fazit: Alle meine Tests von KIs laufen darauf hinaus, dass die KI recht gut darin ist, menschliche Problemlösungsstrategien zu imitieren. Der entscheidende Punkt ist aber, dass sich diese Dinge irgendwie in Worte fassen und rational erklären lassen müssen. Doch was Musik im Speziellen und Kunst im Allgemeinen in uns auslöst, lässt sich nie vollständig verbal ausdrücken. Wir können versuchen, unsere Eindrücke zu benennen, aber das sind immer nur grobe Annäherungen an das, was sich in Kopf und Herz gleichzeitig abspielt – wenn Erinnerungen wachgerufen, Bilder evoziert, Sehnsüchte geweckt und Gefühle ausgelöst werden, für die wir nicht so richtig Worte finden.

Wenn es darum geht, den passenden Song für eine Filmszene zu finden, dann ist das eine Übersetzungsleistung von einer Kunstform zu einer anderen. Die Filmszene hat immerhin den Vorteil, dass sie sich beschreiben lässt; so, wie das Drehbuch das tut. Trotzdem ist für die Musikauswahl der Subtext mindestens genauso wichtig. Er enthält das, was in der Beschreibung höchstens zwischen den Zeilen steht. Und diese unausgesprochene Botschaft müsste nun durch einen Song aufgenommen, verstärkt oder konterkariert werden, wobei dieser Song die Botschaft wahrscheinlich auch nur implizit transportiert?

Es ist völlig klar, dass eine KI bei dieser Aufgabe nur scheitern kann. Erst, wenn wir es mit empfindungsfähigen Systemen zu tun bekommen, dann dürfen wir von einer Software bei dieser Aufgabe echte Hilfe erwarten. Das wird aber hoffentlich so schnell nicht passieren – denn dann können wir auch gleich die ganzen Filme von der KI drehen lassen. Und uns fragen, was wir als Menschheit jetzt noch für eine Existenzberechtigung haben.

Das heisst aber nicht, dass Audioatlas bei simplen Anforderungen nicht weiterhelfen kann. Wir müssen auch nicht unbedingt die Songs nehmen, die uns empfohlen werden. Es reicht schon, wenn sie uns auf eine Idee bringen, in welche Richtung wir suchen könnten …

Beitragsbild: Country Music wäre bei Heidi nicht komplett falsch gewesen (Drew Beamer, Unsplash-Lizenz).

Kommentar verfassen