Notebook LM mauserte sich in den letzten Monaten zu einem wichtigen Hilfsmittel für Informationsarbeiter. Im Kern ist es eine Ablage für digitale Dokumente zu einem bestimmten Thema – wie ein Ordner auf der Festplatte. Der eigentliche Clou ist – wie das LM im Namen verrät –, dass diese Ablage mit einem Language Model (Sprachmodell) ausgestattet ist.
Es hilft bei der Auswertung der Informationen: Wir stellen Fragen zum Inhalt und lassen uns von der künstlichen Intelligenz die wichtigsten Punkte herausarbeiten und Dinge wie Zeitleisten oder Personenverzeichnisse generieren. Und wie in einem normalen Notizbuch dürfen wir eigene Notizen, Ideen und To-dos erfassen.

Der entscheidende Unterschied zu «normalen» KI-Anwendungen wie ChatGPT oder Claude besteht darin, dass sich die Antworten auf das eigene Material beziehen und nicht aus dem allgemeinen Fundus des Trainingsmaterials¹. Seit ich Notebook LM vor gut anderthalb Jahren vorstellte, sind viele Neuerungen dazugekommen. Nicht zuletzt gibt es die Oberfläche inzwischen auch in Deutsch.
Eine wichtige Neuerung sind die diversen Methoden, mit denen sich der Inhalt visuell und multimedial erschliessen lässt. Sie finden sich im rechten Bereich mit der Bezeichnung Studio:
1) Das Recherchematerial als Podcast
Die Audiozusammenfassung ist eine Art Kurzpodcast, bei dem sich zwei Personen über das gesammelte Material unterhalten. Ich führe sie gern bei meinen Schulungen zur KI-Recherche vor, denn sie ist für einen echten Überraschungseffekt gut – zumal bei Leuten, die nicht sehr tief in der KI-Materie drinstecken.
Die Meinungen gehen jeweils auseinander, ob das eine reine Spielerei oder eine nützliche Funktion ist. Mindestens ein Kollege lässt sich die Audiozusammenfassungen seiner wissenschaftlichen Paper herunter und hört sie sich beim Joggen an – eine Methode, für die ich höchste Sympathien hege. Auf alle Fälle demonstriert dieser virtuelle Podcast die Idee des Liquid Content. Sie besagt, dass sich Inhalte mittels künstlicher Intelligenz in höchst unterschiedliche Darreichungsformen verwandeln lassen.

Durch einen Klick aufs Bleistift-Symbol wählen wir die Sprache der Audiozusammenfassung. Wir haben vier Varianten zur Auswahl, nämlich die detaillierte Analyse, die Zusammenfassung, die kritische Bewertung und eine Diskussion. Und wir dürfen jeweils den Prompt anpassen und dort festlegen, welche Aspekte uns besonders interessieren.
2) Die Mindmap
Seit Kurzem erstellt Notebook LM auch Mindmaps. Nachfolgend ein Beispiel mit dem Material, das ich für meinen Artikel 50 Jahre an der Weltspitze: Ist der Erfolg von Microsoft verdient? sammelte (und kaum brauchte, weil mir die wichtigen Punkte alle selbst eingefallen sind).
In der App ist die Grafik interaktiv, d. h., die einzelnen Äste dürfen aus- und wieder eingeklappt werden: Ohne Zweifel ist das eine hervorragende Möglichkeit, sich mit Details zu beschäftigen und gleichzeitig das grosse Ganze nicht aus den Augen zu verlieren. Ich fände es toll, solche Mindmaps hier im Blog integrieren zu können. Das geht bisher leider nicht.

3) Karteikarten

Diese Option richtet sich weniger an Journalistinnen und Journalisten, sondern an Schüler und Studentinnen. Die Karteikarten sind dazu gedacht, sich intensiv mit einem Thema auseinanderzusetzen und sattelfest genug für eine Prüfung zu sein.
Und ja, wenn wir darüber nachdenken, könnte das auch für andere Nutzerinnengruppen nützlich sein: Manager, die sich in einer Sitzung oder in einer Medienkonferenz kritischen Fragen stellen müssen, und Bloggerinnen, die an eine Fernsehdiskussion eingeladen sind, um über ein kniffliges Thema detailkundig Auskunft geben zu können.
4) Berichte
In diesem Bereich finden sich diverse Auswertungsformen: Überblick, Lernplan, Strategie-Memo, historische Fallstudie, biografisches Porträt, chronologischer Überblick oder auch der Blogpost. Auch hier wählen wir die Sprache und passen den Prompt an. Wir haben die Möglichkeit, einen eigenen Bericht einzurichten. Aus journalistischer Sicht bietet es sich an, die wichtigsten Punkte aufzuzählen und so gliedern zu lassen, dass sie sich spannend und flüssig erzählen lassen.

5) Quiz
Wie der Name sagt: Mit dieser Option finden wir auf spielerische Weise heraus, wie gut wir mit der Materie vertraut sind. Zum erwähnten Beispiel des Microsoft-Jubiläums liefert mir Notebook LM zehn Fragen, erstens: «Was war der entscheidende strategische Vorteil im Vertrag zwischen Microsoft und IBM im Jahr 1980, der den Grundstein für den Erfolg von Microsoft legte?» Die Antwort gibt es im oben verlinkten Beitrag.
6) Videoübersicht
Diese Option generiert entweder ein Erklärvideo oder aber eine Zusammenfassung. In den Einstellungen haben wir mehrere visuelle Stile zur Auswahl (klassisch, Whiteboard, Wasserfarben, Retro-Druck, traditionell, Papierkunst und Anime). Wir geben die Sprache vor und passen den Prompt unseren Vorstellungen an.

Ich habe die Videozusammenfassung für zwei meiner Demo-Notizbücher ausprobiert. Microsofts 50-Jahre-Jubiläum mit den Standard-Optionen führt zu einem fast achtminütigen Clip, der mittels KI-generierter Grafiken die Historie kurz nachzeichnet.
Die Erzählweise ist nüchtern bis leicht langweilig und entspricht dem Ansinnen, die Story des Unternehmens linear zu erzählen. Ein Journalist und eine Kennerin von Microsoft hätten eigene Akzente gesetzt und nicht nur die wichtigen Ereignisse aufgezählt, sondern auch vermeintlich unwesentliche Episoden herangezogen, um das Gespür für das Unternehmen und die prägenden Figuren herauszuarbeiten.
Und wir müssen nicht darüber diskutieren, dass ein längeres Video, das aus computergenerierten Bildern besteht und keinerlei Originalmaterial präsentiert, schnell blutleer und abgehoben wirkt.
Das gilt auch fürs zweite Beispiel: Es basiert auf den Biografien von Walter Isaacson über Steve Jobs. Wie oben ersichtlich, habe ich einen reichlich zugespitzten Prompt verwendet, der die beiden Tech-Grössen in einem Kampf um den Titel des grössten Innovators aller Zeiten antreten lässt.
Ohne Zweifel: Es ist beeindruckend, wie die künstliche Intelligenz einen solchen Clip in einer halben Stunde aus dem (nicht vorhandenen) Ärmel schüttelt. Es ist nicht verwunderlich, dass sich manche Menschen eingeschüchtert oder gar komplett ersetzbar fühlen, weil sie für die gleiche Arbeit Tage oder eher Wochen gebraucht hätten.
Aber das Jobs-Musk-Beispiel ist für mich vor allem ein Beweis dafür, dass Minderwertigkeitsgefühle nicht angebracht sind. Ich wäre (mutmasslich) zu einem diametral anderen Fazit gelangt als die KI – und zwar, weil ich ein Mensch bin und als solcher manche Dinge unweigerlich anders gewichten würde.
Vor allem bin ich überzeugt, dass eine lebende Videokünstlerin diesen Clip knackiger hinbekommen hätte – mit einem weniger buchhalterischen Ansatz. Sie hätte es geschafft, die Emotionen eines Wettkampfs zu wecken, die bei Gemini in keiner Sekunde spürbar sind.
Das heisst für mich: Die hier gezeigten KI-Videos, aber auch die Audiozusammenfassungen würde ich nie eins zu eins veröffentlichen. (Dass ihr sie hier seht, ist die Ausnahme von der Regel, die die Regel bestätigen soll.) Das entspricht nicht meinem Ansatz als Blogger und meinem journalistischen Ethos schon gar nicht. Es kann sinnvoll sein, einen simplen, unbestrittenen Sachverhalt auf diese Weise darzulegen. Aber als Journalismus-Ersatz taugen diese KI-Medien nicht.
Halten wir fest, dass wir biologischen Daseinsformen mit unserer Fantasie, den Erfahrungen, Bauchgefühlen und Intuitionen weiterhin als einzige in der Lage sind, echte, wahre Kunst zu produzieren.
Fussnoten
1) Für das implizite Weltwissen, das im gesammelten Bestand nicht vorhanden ist, braucht es den Rückgriff aufs Trainingsmaterial natürlich trotzdem. ↩
Beitragsbild: Das Video zu 50 Jahre Microsoft am Handydisplay.
