Eine Person sitzt entspannt am Schreibtisch mit Monitor, Notizbuch und Smartphone. Die Beine liegen auf dem Tisch, und Kopfhörer sind aufgesetzt. Der Hintergrund ist hell und neutral.
Bald werden die Füsse auf dem Pult ein Anzeichen dafür sein, dass jemand besonders kreative Arbeit leistet (www.kaboompics.com, Pexels-Lizenz).

So fliessen die Ideen ungehindert

Damit hätte ich nie ge­rech­net: Eine simple App hilft bei der Ideen­fin­dung und bei der Kon­zept­ar­beit. Beim Brain­stor­ming die un­ge­ord­neten Ge­danken von Whisper Notes pro­to­kol­lie­ren und von der KI struk­tu­rie­ren lassen.

Es ist ein bittersüsses Happy End: Heute, im Jahr 2026, sind wir in der Lage, unsere Eingaben am Computer per Stimme vorzunehmen. Das ist eindrücklich: Als vor fast dreissig Jahren die ersten Spracherkennungsprogramme auf den Markt kamen, waren die weder benutzerfreundlich noch wirklich alltagstauglich. Die Entwicklung verlief anfänglich harzig. Doch in den letzten Jahren mehrten sich die Anzeichen für einen Durchbruch.

Und als ich neulich zwei Programme testete, mit denen sich Texte am Computer einsprechen lassen, lautete das schnörkellose Fazit: Es funktioniert. Die Transkription mag zwar nicht hundertprozentig perfekt sein. Doch wenn wir sie von einem Sprachmodell wie ChatGPT oder Gemini bereinigen lassen, ist das Resultat so gut wie selbst getippt.

Transkribieren mit dem iPhone, aber ohne Cloud

Das Experiment, über das ich heute berichte, bestätigt diesen Befund. Und es steuert drei weitere Erkenntnisse bei:

  1. Die getestete App, Whisper Notes (vier Franken), ermöglicht die Transkription auf dem iPhone. Sie arbeitet ohne Cloud und eignet sich für sensible Inhalte.
  2. Diese Methode funktioniert nicht nur für kurze Sprachnotizen, sondern auch für ein langes Diktat.
  3. Und apropos bittersüss: Falls wir uns erhofft haben, aufgrund des Fortschritts nie wieder Texte tippen zu müssen, dann müssen wir heute feststellen, dass das nicht der Fall ist. Aber für die passenden Anwendungsfälle ist die Diktatmethode unschlagbar.

Lasst mich diese Aspekte im Detail ausführen und mit dem letzten Punkt beginnen:

Wie neulich beim Test von Macwhisper und Audiopen festgestellt, ist (zumindest für mich) das Diktieren von Artikeln und Blogposts nicht praktikabel: Die Arbeit mit dem Text – das Umformulieren, Verändern, Löschen, Umstellen und Verdichten und Verfeinern – ist integraler Bestandteil des kreativen Prozesses. Er ist zwingend und inkompatibel zur Eingabe per Sprache. Eine Malerin muss die Farben auch selbst mischen und auftragen. Dem Assistenten zu erklären, wie er das tun sollte, führt nicht zum Ziel.

Das heisst aber nicht, dass der ganze schöne technische Fortschritt umsonst gewesen wäre. Denn in anderen Bereichen funktioniert die Methode des Diktats perfekt. Mein ideales Betätigungsfeld ist das Brainstorming.

1) Die Ideen einsprechen

Bildschirmaufnahme eines Audioplayers mit Transkriptionsschrift. Der Text behandelt die Auswirkungen von KI auf die Arbeitswelt und nennt verschiedene Einsatzmöglichkeiten von Sprachmodellen.
Das Transkript ist nicht über alle Zweifel erhaben. (Mit «Catchi Pity» wäre ChatGPT gemeint.)

Ich werde am 30. Mai 2026 an der Fachtagung «KI trifft Autismus» des Vereins Autismus Schweiz eine Einführung halten. Ich hatte eine grobe Vorstellung im Kopf, wie ich das Referat würde gliedern wollen. Statt die in einer Text-App, einem Outliner oder einem für Mindmaps geeigneten Zeichnungsprogramm auszuarbeiten, kam ich auf die Idee, mein Konzept sprechenderweise auszuarbeiten.

Das funktionierte maximal einfach: Whisper Notes-App aufstarten, den Aufnahmeknopf drücken und loslegen. Ich sprach meine Ideen in Hochdeutsch ein und hatte zuvor in den Einstellungen bei Modus auf Genau (1,6× langsamer) umgeschaltet. Dann legte ich los und umriss meine Ideen während einer guten Viertelstunde. Die Transkription erfolgte zügig – und wie erwähnt direkt auf dem Gerät.

2) Die Rohfassung korrigieren und bereinigen

Die Rohfassung wirkt auf den ersten Blick wenig brauchbar: Der ganze Text wird durch eingestreute Zeitmarken willkürlich unterbrochen, wird ansonsten als einziger Bandwurm (ein langer Absatz) abgeliefert, und einige der technischen Begriffe sind falsch. Doch dieses Problem lässt sich per KI korrigieren. Mit einem simplen Prompt¹ liefert ein aktuelles Sprachmodell ein einwandfreies Transkript.

Nebenbei erlaubt es die Whisper Notes-App, das Transkript anhand der Originalaufnahme zu überprüfen: Tippen wir einen Satz in der Verschriftlichung an, wird die korrespondierende Stelle der Aufnahme wiedergegeben – das ist auch praktisch, um sich längere Aufnahmen zu erschliessen.

3) Struktur und Ordnung in die Gedanken bringen

In einem zweiten Schritt bitte ich die KI, aus der Rohfassung einen strukturierten Ablauf für den Vortrag zu stricken². Für diese Aufgabe kommen ChatGPT und Gemini zum Zug. Beide meistern sie mit Bravour – die Variante von Gemini gefällt mir ein μ besser. Die Gliederung ist jeweils nach Themen geordnet, in denen wiederum die wesentlichen Punkte aufgeführt sind. Die Tools, die ich ansprechen will, listet Gemini tabellarisch. Und sogar die bloss angedeuteten Konzepte sind fertig ausformuliert.

Inhalt eines Dokuments über KI-Tools mit einer Gliederung zu Anwendungsbereichen, Stärken, Datenschutz und Empfehlungen für die Nutzung mehrerer Modelle zur optimalen Ergebniserzielung.
Gemini gab der Abfolge der Gedanken eine Struktur – inklusive Übersichtstabelle.

Daraus eine Präsentation zu fertigen, ist (dank dieser Tricks hier) ein Klacks!

Fazit: Das werde ich garantiert demnächst wieder so machen. Brainstorming per Diktat funktioniert aus folgenden Gründen:

  • Es gibt keine Ablenkung.
    Selbst mit einer maximal einfachen Software sind wir gezwungen, einen Teil der Hirnkapazität für die Bedienung zu nutzen. Beim Diktat gibt es keine Benutzerschnittstelle. Wir können das Smartphone oder den Computer komplett unsichtbar machen, indem wir das Gerät ausser Sicht deponieren.
  • Es entsteht eine echte Trennung zwischen Form und Inhalt.
    Wir müssen uns nicht damit aufhalten, in welcher Reihenfolge wir die Bullet Points aufführen wollen – und ob eine verschachtelte Liste oder doch hierarchische Unterpunkte besser geegnet sind. (Und ja, für mich sind derlei Fragen notorisch.)
  • Wir haben die Hände frei.
    Das muss nicht, aber es kann beim Denken helfen.
Mehrere Hände interagieren mit gelben Haftnotizen auf einem blauen Tisch. Die Notizen enthalten handgeschriebene Texte. Im Hintergrund sind Schreibutensilien und ein Plastikbecher sichtbar.
Die beliebte Methode des Brainstormings mittels Zettelwirtschaft geht bei mir meist ins Leere (Fortytwo, Unsplash-Lizenz).

Fazit: Es funktioniert – unter den richtigen Voraussetzungen

Der Unterschied zum Bloggen oder Schreiben besteht darin, dass beim Brainstorming kein Endprodukt angepeilt wird. Statt eines ausgearbeiteten und gut lesbaren Textes peilen wir Rohmaterial an. Aus dem könnten wir natürlich auch einen schönen Artikel oder einen prägnanten Blogpost erstellen. Aber die Stärke der KI ist, wie sich zeigt, eine Ansammlung von Gedanken zu gliedern und zu strukturieren – es wäre schade, diese Möglichkeit ungenutzt zu lassen.

Natürlich funktioniert das Brainstorming per Diktat, wenn die Angelegenheit in unserem Kopf bereits ausreichend ausgereift ist, um monologisch beschrieben zu werden. Was mich angeht, habe ich ein feines Gespür dafür, wann die Zeit reif ist, solche Gedanken zu konkretisieren.

Deswegen ist für mich die App am iPhone besonders praktisch. Es passiert mir häufig, dass der passende Moment genau dann eintritt, wenn ich Gelegenheit habe, meine Gedanken mäandern zu lassen – beim Warten am Bahnhof, beim Joggen oder während der Hausarbeit. Wenn ich dann bloss den Aufnahmeknopf zu drücken brauche, um das Ergebnis eines kreativen Anfalls einzufangen, dann erleichtert mir das mein Leben enorm.


Ein Hinweis: Achtet darauf, ob die Transkription vollständig ist. Aus nicht ersichtlichen Gründen wurde bei einer Transkription nur der Anfang kopiert. Nichts ging verloren; sowohl das vollständige Audio als auch der ganze Text waren vorhanden. Aber nicht alles landete in der Zwischenablage.

Fussnoten

1) Das ist der Prompt, um die Rohfassung zu korrigieren:

Das folgende ist ein Transkript einer Brainstorming-Session. Ich benötige davon eine 1:1-Wiedergabe. Bitte behalte den Text im Original-Wortlaut bei, aber korrigiere Transkriptionsfehler (wie «Zweiterteil» und «Dritterteil», GROC statt Grok und ähnliche Dinge) und teile das Transkript thematisch in Abschnitte (Absätze) ein.

2) Der Prompt für den Ablauf:

Bitte bereinige mir das folgende Transkript einer Brainstorming-Sitzung von sprachlichen Redundanzen und Transkriptionsfehlern. Behalte alle Konzepte und Ideen bei und gliedere sie sinnvoll.

Kommentar verfassen