Ein beleuchtetes Zelt steht nachts in einem Wald. Der Sternenhimmel ist klar sichtbar über den dunklen Baumkronen.

Geräuschkulissen nach Mass

Mein Ziel war, mir per künst­li­cher In­tel­li­genz schöne Hin­ter­grund­ge­räusche für ein Audio­pro­jekt ge­ne­rie­ren zu lassen. Das hat nur halb ge­klappt. Dafür habe ich eine tolle akus­ti­sche En­tspan­nungs­hilfe ent­deckt.

Stellen wir uns vor, wir würden eine hübsche Audioproduktion ins Auge fassen wollen: ein Hörspiel vielleicht, oder einen aufwendig produzierten Podcast. Eine Komponente, die wir dafür benötigen würden, sind Hintergrundgeräusche. Die Töne, die nur für die Atmosphäre zuständig sind, also nicht direkt mit der Handlung im Zusammenhang stehen (wie Fussstapfen oder Pistolenschüsse), nennt man Atmo.

Die aufzutreiben, ist zeitraubend: Wir müssen uns durch Archive (wie hier oder hier) kämpfen und finden oft doch nichts genau Passendes. Doch schliesslich leben wir im Zeitalter der künstlichen Intelligenz. Da sollte es doch möglich sein, dieses Rohmaterial nach Bedarf zu erzeugen.

Und tatsächlich: Es gibt einige Anbieter, die mittels künstlicher Intelligenz anhand einer Textbeschreibung die passende Soundkulisse anfertigen:

1) Lalals

Das aus München stammende Unternehmen Lalals entwickelt nach der eigenen bescheidenen Meinung die «weltweit fortschrittlichsten KI-Algorithmen für die Stimmveränderung». Es gibt diverse Tools für Audioproduktionen, namentlich für Stimmen: Die lassen sich klonen, zum Einsprechen von geschriebenem Text benutzen und von Hall oder Hintergrundgeräuschen befreien. Ferner gibt es einen Lyrics-Detector, der aus Musikaufnahmen den Text extrahiert, eine Analyse zur Erkennung von Tempo (BPM) und Tonlage. Schliesslich gehört auch eine Musik-KI à la Suno zum Angebot.

Für die Erzeugung der Atmo ist der AI Sound Generator zuständig. Bei meinem Test kam der folgende Prompt zum Zug:

In einer Raumstation, in der man das leise Summen der Lüftungssysteme, gelegentliche Pieptöne, das Öffnen und Schliessen von Drucklufttüren und die Schritte der Mitarbeiter auf dem Boden hört. (Inside in a space station with some low humming of ventilation systems, occasional beeping and air pressured doors opening and closing and footsteps of staff members on the floor.)

Das Resultat klingt mir zu wenig nach Weltraum:

Ähnlich hört es sich auf der Erde in einem Lager- oder Kühlraum an; und die Türgeräusche sind zu laut; schliesslich soll dieser Sound im Hintergrund laufen, während im Vordergrund z. B. ein Text gesprochen wird oder ein Dialog stattfindet. Und mit fünf Sekunden ist er für diesen Zweck auch zu kurz.

2) ElevenLabs

Das ist noch so ein Gemischtwarenladen im KI-Audio-Bereich. Ich habe die Sprachsynthese und das Stimmen-Klonen ausprobiert und finde die Reader-App, mit der sich Artikel vorlesen lassen, ganz passabel. Der Sound-Effects-Generator liefert für den gleichen Prompt wie oben vier Varianten. Die beste ist diese hier:

Auch hier habe ich keinen Moment das Gefühl, in den weiten Welten des Alls unterwegs zu sein, wo das Summen eine Art akustisches Beruhigungsmittel ist: Denn die Maschinen sind für die Lebenserhaltung zuständig, und solange sie ihren Dienst verrichten, ist alles in Ordnung.

Fazit: Leider eine Enttäuschung. Ich würde keinen dieser Tracks verwenden wollen. Vielleicht wäre das Resultat besser, wenn wir den Prompt vereinfachen, die Geräusche der Füsse auf dem Boden weglassen und dafür das Summen genauer beschreiben würden: tief, in einer trockenen Atmosphäre und zutiefst beruhigend.

Da Capo: Moodist-App

Eine Benutzeroberfläche zur Auswahl von Naturgeräuschen. Optionen umfassen Fluss, Wellen, Lagerfeuer, Wind, heulender Wind, Wind in Bäumen, leichter Regen, starker Regen und Donner. Play-Button oben.
Aus Einzelaufnahmen lässt sich eine Soundkulisse nach Mass abmischen.

Damit dieser Blogpost nicht mit zwei Fehlschlägen endet, hier eine Geräusche-App, die mich vollumfänglich befriedigt. Vielleicht, weil sie nichts mit KI zu tun hat. Sie zielt auch nicht auf ein professionelles Publikum, sondern auf die private Nutzung. Wie Noisli und die Hintergrundgeräusche-Funktion beim iPhone ist das Ziel, uns auf akustischem Weg zu Stressabbau zu verhelfen. Auch als Einschlafhilfe taugen diese Klangwelten, die uns helfen, uns geistig an einen bestimmten Ort zu versetzen und das Gedankenkarussell zum Stillstand zu bringen.

Es handelt sich um die Moodist-App, die als Open Source veröffentlicht wurde. Wir finden hier 72 Sounds aus den Bereichen Natur (Fluss, Wellen, Lagerfeuer, Wind und Bäumerascheln), Regen in verschiedenen Stärken, Tiere (Vögel, Möwen, Grillen, Eulen, Vögel, schnurrende Katzen, Krähen, Schafe), Städtisch (Einkaufsstrasse, Strassenlärm, Menschenmenge), Orte (Kaffee, Kirche, Flughafen, Baustelle), Verkehr (Bahnhof, Zug, Flugzeug, Segelboot), Alltagsgegenstände (Tastatur, Schreibmaschine, Windspiel, Standuhr) sowie weisses, braunes und rosarotes Rauschen. Die einzelnen Sounds lassen sich parallel abspielen, d. h., zu einer Geräuschkulisse arrangieren und separat in der Lautstärke regeln.

Der lauen Nacht beim Zelten im Wald, mit leisem Regen und einem Käuzchen in der Ferne, steht mit dieser schönen Webanwendung nichts im Weg.

Beitragsbild: Bei diesem Foto haben wir die Geräuschkulisse sogleich im Ohr (Alex Moliski, Unsplash-Lizenz).

Kommentar verfassen