So nehmen wir Mark Knopfler die Gitarre weg

Für Musike­rin­nen, Musik­fans und Musik-Hackerin­nen: Lalal.ai zer­legt Musik­stücke in ein­zel­ne Spuren, mit Ge­sang und I­stru­men­ten. Für alle, die «Sultans of Swing» mal mit Uku­lele hören wollen.

Das ist ein echt cooles Spielzeug und ein Highlight für meine Rubrik Wenn ich einmal Zeit habe. Ich habe keinen Schimmer, was ich damit tun würde. Aber ich bin überzeugt, dass mir etwas einfallen würde. Vermutlich etwas, wofür ich im Gefängnis landen würde.

Es geht um lalal.ai: Das ist eine Software, die eine fertig abgemischte Musikaufnahme wieder in ihre Einzelteile zerlegt. Das Resultat sind separate Audiospuren für den Gesang und die einzelnen Instrumente. Ich habe es mit Sultans of Swing von den Dire Straits probiert und konnte mir in der Folge die Gesangsspur, Schlagzeug, Bass, Gitarre und den Gesang separat anhören: Fast so, als wenn ich am Studiomischpult an der Mehrspur-Bandmaschine sitzen würde.

Lalal.ai extrahiert eine Spur aus der Aufnahme und erlaubt, sie separat zu hören oder gegenüber dem Minus-Signal lauter oder leiser zu machen.

Natürlich wollt ihr an dieser Stelle sofort wissen, wie sich das anhört. Und natürlich habe ich ein akustisches Beispiel parat. Ich habe mit der zerlegten Variante von «Sultans of Swing» im Nerdfunk ein Musikquiz veranstaltet.

Falls ihr direkt mit dem Musikquiz einsteigen wollt. Es startet bei Minute 8:20 – und ist absolut hörenswert!

Das freut den Audio-Nerd. Alle vernünftigen Leute werden sich indes fragen, was man damit anstellen könnte. Es gibt zwei Einsatzmöglichkeiten:

1) Verstehen, wie aus Einzelleistungen ein Band-Musikerlebnis wird

Als Musikerin oder Musiker konzentrieren wir uns ganz auf ein Instrument. In einem fetten Mix gehen die Details typischerweise unter, sodass die Feinheiten der Darbietung nicht gut herauszuhören sind. Mit Lalal.ai können wir die Spur entweder völlig isoliert anhören oder aber auch in den Vordergrund holen. Da ich selbst leider kein Instrument beherrsche, leuchtet mir der Nutzen nur auf theoretischer Ebene ein. Aber ich kann mir nicht vorstellen, dass eine solche Dekonstruktion nicht extrem hilfreich ist, um die Feinheiten zu verstehen, die einen Song und ein Arrangement ausmachen.

Apropos: Die Separation funktioniert gut; ist aber nicht perfekt. Bei der Bassspur von «Sultans of Swing» ist an einzelnen Stellen ein bisschen etwas von der Gitarre mit drin. Das kann daran liegen, dass ich die MP4-Variante habe aufsplitten lassen.

2) Versatzstücke stehlen

Diese zweite Einsatzmöglichkeit erklärt auch, warum uns potenziell Gefängnis droht, wenn wir unseren kreativen Ideen mit Lalal.ai freien Lauf lassen: Wir würden diese Versatzstücke nutzen, um ein eigenes Werk herzustellen. Mark Knopflers Gesang mit Handörgeli statt mit Gitarre? Warum nicht?

Nein, natürlich liesse sich ein solches Projekt urheberrechtlich einwandfrei abwickeln. Für einen Remix braucht es eine Lizenz des Rechteinhabers oder eine Pauschallizenz der Verwertungsgesellschaft. Oder wir suchen ein schönes Uralt-Stück, das inzwischen gemeinfrei ist.

Tipp: Verlustfrei komprimiertes Audio verwenden!

Ein Tipp für eigene Experimente – der natürlich auf der Hand liegt: je besser die Audioqualität, umso sauberer die Trennung. Wie erwähnt, habe ich eine MP4-Datei verwendet. Die hat zwar eine ordentliche Bitrate von 268 kbps, aber dennoch handelt es sich um ein Format mit verlustbehafteter Komprimierung. Das führt dazu, dass sich die ausgebeinten Tracks oft «matschig» anhören. Das liegt daran, dass durch die Separation Details zum Vorschein kämen, die der psychoakustische Algorithmus zur Reduktion der Datenmenge weglässt. Es lohnt sich daher, Material in CD-Qualität oder, noch besser, HD-Audio zu verwenden.

Zerlegt nach allen Regeln der Kunst: «Sultans of Swing» von Dire Straits mit Spuren für die Stimme, Gitarre, Bass und Drums. Denn als bezahlender Kunde dürfen wir die separierten Traks herunterladen (hier jeweils im WAV-Format) und in einer Audiosoftware wie Audacity bearbeiten.

Am Schluss bietet sich ein kleiner historischer Abriss an. Diese Technik ist nicht neu; im Gegenteil: Schon 1999 fanden sich in Musikzeitschriften Hinweise auf sogenannte Vocal Eliminators. Sie entfernen den Gesang aus einer Aufnahme, damit die Leute selbst dazu singen können. So liegt es auf der Hand, dass der Wikipedia-Beitrag zum Karaoke einige technische Hintergründe erklärt. Schon im analogen Zeitalter gab es die Out of Phase Stereo-Methode, mit der gewisse Bestandteile aus dem Stereomix entfernt oder isoliert werden konnten. Es liegt auf der Hand, dass die Resultate im Gegensatz zur KI-Bearbeitung nur unter idealen Bedingungen eine saubere Trennung erlaubt.

Abrechnung nach Minuten

Nochmals zurück zu Lalal.ai: Mir gefällt, dass wir für diese Webanwendung kein Abo benötigen. Stattdessen kaufen wir Credits: Das Lite Pack – das ich für meine Experimente gebucht habe – kostet zwanzig Euro und erlaubt es, neunzig Minuten Audio zu bearbeiten: Soweit ich es kapiert habe, können wir leider nicht einen Song in einem Rutsch in sämtliche Komponenten zerlegen, sondern investieren Minuten für einzelne Splits (z.B. Bass separat, sowie Song ohne Bass). Das trübt meine Freude etwas; doch für typische Songs aus dem Rock- und Pop-Bereich ist es verkraftbar.

Nebst dem Lite Pack gibt es das Plus Pack für 27 Euro und 300 Minuten, sowie Pro Pack für 35 Euro und 500 Minuten.

👉 Eine Alternative ist die Moises-App. Ich stelle sie im Beitrag So pfuschen wir Mark Knopfler ins Handwerk vor.

Beitragsbild: Natürlich geben wir sie hinterher wieder zurück (Simon Weisser, Unsplash-Lizenz).

Kommentar verfassen