Aus unerfindlichen Gründen habe ich seit Kurzem einen Narren an Musik-KIs gefressen. Allerdings nicht an Suno und Konsorten, die per Prompt Songs generieren. Sondern vielmehr an Tools, die «echte», von Menschen gemachte Werke verarbeiten und spannende Erkenntnisse zu unserer Lieblingsmusik vermitteln.
Ein praktisches Werkzeug, so dachte ich mir, wäre eine Anwendung, die Gesang in Noten umwandelt. Das wäre eine tolle Einstiegshilfe für Leute ohne musikalische Ausbildung (wie mich). Beim Erzeugen der Klänge helfen diverse Programme wie Garageband oder Sunvox. Die Herausforderung besteht darin, die Melodie in die Software hineinzubekommen, wenn man nicht in der Lage ist, die Noten niederzuschreiben oder auf einem Keyboard zu spielen. Aber singen oder summen kann jeder. Und so liesse sich diese Hürde überwinden.
Apple lancierte 2016 zu diesem Zweck die Musikmemos-App. Die zeichnete am iPhone gesungene oder gesummte Song-Ideen auf. Die extrahierte Rhythmus, Tempo und Akkorde, fügte eine Rhythmusspur (Bass und/oder Schlagzeug) hinzu und übertrug das Werk zur Weiterbearbeitung an Garageband. Heute wäre das eine Steilvorlage, um mithilfe künstlicher Intelligenz bei der Kreation von Stücken zu helfen, die nicht wie bei Suno reine KI-Produkte wären, sondern einen nennenswerten menschlichen Anteil hätten. Doch aus für mich nicht einleuchtenden Gründen zog Apple Musikmemos 2021 den Stecker.
Gibt es Nachfolger? Bei der Suche stosse ich auf zwei Kandidaten:
1) Scorecloud Songwriter
Das Programm Scorecloud Songwriter existiert für Windows und Mac. Es transkribiert die Aufnahme, erlaubt eine Bearbeitung im Editor und exportiert in der Rubrik Notes in den Formaten Midi, MusicXML und PDF.
In der Rubrik Sheet ist die Originalaufnahme zu hören, die sich durch automatisch erzeugte Midi-Spuren ergänzen lässt: Am aufschlussreichsten ist Midi Melody: Da werden die erkannten Noten wiedergegeben. Die App ergänzt Begleitspuren wie das Midi Accompaniment , bei dem wir diverse Klaviervarianten, Vibrafon, Xylofon, Akkordeon und andere Instrumente auswählen. Via Drum Pattern unterlegen wir die Aufnahme mit einem Schlagzeug in Stilrichtungen wie Pop, Latin oder Jazz oder Bossa. Die Software trennt in der Aufnahme Instrumente und Gesang – aber sie tut es nicht so gut wie Lalal.ai und Moises. Wir können diese Spuren separat ein- und ausschalten und mit der Option Show Mixer in der Lautstärke ändern.

Es gibt drei Abos. Die günstigste Plus-Variante kostet sechs US-Dollar im Monat bzw. 60 Dollar im Jahr und dürfte für viele Zwecke selbst im Amateurbereich zu schmalbrüstig sein. Sie transkribiert keine Audiodateien und unterstützt den MusicXML -Export nicht. Die beiden teureren Abonnements sind Songwriter für 119 Dollar im Jahr und Pro für 149 Dollar und beherrschen diese wesentlichen Features.
Scorecloud Express ist die abgespeckte Variante fürs iPhone und iPad, die für drei Franken zu kaufen ist. Dafür lassen sich bis zu zehn Songs in der Cloud speichern.
2) Sing2Notes
Sing2Notes lässt sich im Browser, am iPhone und iPad und am Android-Telefon einsetzen. Wir singen entweder oder laden eine Aufnahmen hoch.
Das Resultat gibt es als PDF, in Midi-Form und im digitalen Standardformat MusicXML. Die Noten sind bearbeitbar, und die transkribierte Melodie lässt sich mit der Option Generated Sound als Keyboardmelodie wiedergeben.
Wir dürfen maximal zwanzig Sekunden kostenlos und ohne Registrierung transkribieren. Für häufigere Nutzung gibt es ein Abo für 66 Franken im Jahr oder 7.80 Franken im Monat. Dafür werden monatlich maximal fünfzig Aufnahmen mit bis zu 15 Minuten Länge transkribiert.

Fazit: Welche App ist besser?
Die entscheidende Frage ist natürlich, welche der beiden Apps die Noten besser trifft.
Mein Fazit ist, dass beide nicht perfekt sind. Als musikalischer Laie bin ich nicht kompetent, um die Noten direkt zu beurteilen. Mir fällt allerdings auf, dass sich die Resultate beider Apps beträchtlich unterscheiden. Und meine Ohren verraten mir, dass weder Scorecloud Songwriter noch Sing2Notes jeden Ton treffsicher ins Notenblatt übertragen haben. In beiden Apps haben wir die Möglichkeit, die erkannte Melodie via Midi auszugeben – und da muss man nicht van Beethoven heissen, um zu hören, dass beide Programme auf unterschiedliche Weise danebenliegen.
Ich korrigiere mich: Man sollte nicht van Beethoven heissen, weil Ludwig bekanntlich taub war.
Es ist möglich, dass das relativ ernüchternde Resultat an meinem Testverfahren liegt. Ich habe beide Programme mit Mani Matters berndeutschem Klassiker «Ds Zündhölzli» getestet. Zum Einsatz kamen einerseits die Originalaufnahme und andererseits eine von mir selbst inbrünstig gesungene Aufnahme ohne Gitarrenbegleitung. Ich darf verraten, dass die Resultate bei letzterer schlechter waren, sowohl bezüglich Takt als auch bei der Tonlage.
Für eine Einschätzung bat ich Claude, eine besonders fragwürdige Variante mit der online auffindbaren Original-Partitur zu vergleichen. Die KI kommt zum Schluss, das Stück «Ds Zündhölzli» scheine «mit seinen langen, gebundenen Phrasen und der 3/4-Taktart eine besondere Herausforderung für die Erkennungssoftware darzustellen». Das ist zumindest teilweise falsch, da Partitur und Transkription übereinstimmend einen 4/4-Takt ausweisen.
Ist diese Methode, aller künstlichen Intelligenz zum Trotz, nicht spruchreif? Ich würde nicht so weit gehen. Wir müssen indes bei beiden Apps Rücksicht auf die Schwächen nehmen. Um saubere Noten zu bekommen, ist es nicht verkehrt, nicht mitreissend, sondern übertrieben deutlich zu singen oder summen – und die Songs so fett zu produzieren, dass gelegentliche Unstimmigkeiten in der Dichtheit des Sounds untergehen. 😉
Beitragsbild: Er schaffts (vermutlich) auch ohne eine Noten-Transkriptions-KI (Róger Nobles, Unsplash-Lizenz).