Eine Frau nimmt an einer Videokonferenz auf einem Laptop teil, drei Personen sind auf dem Bildschirm zu sehen. Sie hält einen Stift und schreibt auf Papier.

Nie wieder Sitzungsprotokolle!

Die künst­li­che In­tel­li­genz ist eine ak­ku­ra­te, ge­ra­de­zu pin­ge­li­ge Schrift­füh­rerin. Sie do­ku­men­tiert d­etail­liert und struk­tu­riert, was be­spro­chen wird. Praktisch – aber mutmasslich hin­derlich für krea­ti­ve Geistes­arbeit.

Wenn ihr euch fragt, warum das Interview in vielen Medien einen Höhenflug erlebt, dann verrate ich euch ein Geheimnis: Die künstliche Intelligenz ist schuld. Wer selbst längere Gespräche von Hand abgetippt hat, weiss, was für eine anstrengende und lästige Fleissarbeit das ist. Nebst vielen anderen Tricks ist die KI auch hervorragend darin, Audioaufnahmen zu verschriftlichen – und diese Arbeitserleichterung macht sich inzwischen deutlich bemerkbar.

Doch die schreibende Zunft ist nicht der einzige Profiteur. Dank des rasanten Fortschritts ist die Transkription in den letzten Monaten zu einer Art Commodity geworden: Sie steckt als Hilfsfunktion inzwischen in vielen Anwendungen. Beim iPhone verschriftlicht sie in der Telefon-App die Sprachnachrichten. Und – wirklich praktisch im Büroumfeld – protokolliert sie unsere Sitzungen.

Ich habe die Gelegenheit, das in meinem Arbeitsumfeld auszuprobieren. Da die Tests unter Realbedingungen stattfinden, kann ich die Erkenntnisse nur summarisch wiedergeben. Als Fazit lässt sich festhalten, dass die Protokolle der KI in aller Regel mehr Details enthalten, als wenn ein Kollege oder eine Kollegin sie angefertigt hätte: Sie geben einen akkuraten Eindruck von dem, was besprochen wurde. Für Leute, die die Sitzung verpasst haben, ist es ein hervorragendes Hilfsmittel, sich auf den neuesten Stand zu bringen.

Auch für Teilnehmerinnen und Teilnehmer hat das einen Nutzen: Falls es uns passieren sollte, zwischendurch abgelenkt zu sein und uns in Tagträumen zu verlieren, können wir uns hinterher diskret davon überzeugen, dass wir nichts Wesentliches verpasst haben. (Und diesen Vorteil habe ich besonders ausgiebig und unter vollem Einsatz ausgelotet.)

Lokale Protokolle mit Macwhisper

Einen Nachteil gilt es zu bedenken: Die Transkription findet in der Cloud statt. Bei heiklen Themen ist sie aus Datenschutzgründen nicht zu empfehlen. In solchen Fällen rate ich dazu, eine lokale Software zu verwenden. Meine Empfehlung ist Macwhisper. Seit Version 12 kann sie Sprecherinnen und Sprecher unterscheiden. Wichtig ist, dafür das passende Modell zu nehmen, das durch ein entsprechendes Symbol gekennzeichnet ist.

Das Resultat ist ein vollständiges Gesprächsprotokoll. Aber selbstverständlich steht es uns frei, das mit einem (lokalen) LLM unserer Wahl zusammenzufassen. Im entsprechenden Prompt würde ich darauf hinweisen, dass die einzelnen diskutierten Punkte säuberlich aufgelistet werden sollen und insbesondere festzuhalten ist, welche Entscheidungen getroffen wurden und welche Massnahmen ins Auge gefasst werden.

So ähnlich machen es auch die beiden pfannenfertigen Protokoll-KIs, die ich hier vorstelle:

Automatische Protokolle mit Google Meet

Die Transkription steht in Google Meet für diverse Sprachen, u. a. Deutsch, Englisch, Französisch und Italienisch, zur Verfügung. Wichtig: Wir benötigen Google Workspace in der Standard- oder Plus-Variante (nicht Starter), und die Transkription muss vom Administrator aktiviert werden. Und nur Desktop-User können die Transkription starten. Sie tun das wie folgt:

Rechts unten klicken sie auf Aktivitäten > Transkripte > Sprache‑zu‑Text-Umwandlung starten und schliesslich auf Starten. Dort kann die Transkription gestoppt werden. Das Protokoll wird als Google-Doc gespeichert und zwei Leute erhalten den Link dazu: die Person, die die Videokonferenz organisierte, und diejenige, die die Transkription startete.

Die Aufzeichnung enthält eine Zusammenfassung, eine nach Einzelpunkten gegliederte detaillierte Protokollierung und den Abschnitt «empfohlene nächste Schritte». Google Meet unterscheidet Teilnehmende, wenn sie über den persönlichen Laptop zugeschaltet sind. Ansonsten werden Wortmeldungen mit Formulierungen wie «Jemand im Sitzungszimmer [Hohentwiel] präsentierte …». Das hat zur Folge, dass nicht immer exakt nachvollziehbar ist, wer was gesagt hat. Das ist ein Nachteil, der sich in bestimmten Situationen zu einem unzweifelhaften Vorteil wandelt.

Schweizerdeutsch ist nach wie vor ein Problem, wenngleich nicht mehr ein so grosses wie noch vor Jahren. Aber hey, in unseren globalisierten Schweizer Unternehmen werden Sitzungen eh meist in Englisch abgehalten (vielleicht auch, wie böse Zungen sagen, dass manche von uns sich nicht mit ihrem Französisch blamieren).

AI Meeting Notes in Notion

Notion ist diese Web-Anwendung, die auf vielen Hochzeiten tanzt: Sie ist Notiz-App und Wissensbasis und Werkzeug fürs Projektmanagement und eine Spielwiese für Leute mit einem Hang für ausgeklügelte Abläufe. Wenn Notion für die Organisation verwendet wird, liegt es auf der Hand, die Sitzungen dort zu protokollieren. So wandern alle wesentlichen Informationen in einen Topf: direkt auf der entsprechenden Projektseite.

Ein weiterer Vorteil besteht darin, dass wir mit den AI Meeting Notes nicht auf eine bestimmte Videoconferencing-Software wie Google Meet festgelegt sind. Die Funktion nimmt via Mikrofon auch Gespräche auf, die vor Ort stattfinden. Die Desktop-App verlangt Zugriff aufs System-Audio. Im Browser wird nur via Mikrofon transkribiert, was das Resultat je nach Situation deutlich verschlechtert.

Meine Eindrücke:

  • Notion ist in der Lage, Sprecher auseinanderzuhalten. In manchen Fällen benennt sie der KI-Protokollführer sogar richtig. Wie dieser Trick gelingt, ist unklar.
  • Die Protokolle sind nicht perfekt, jedoch ebenfalls brauchbar. Notion setzt auf Komponenten von OpenAI, Anthropic, Fireworks und Baseten Labs.
  • Sie umfassen eine sauber gegliederte Liste mit den Themen mit Unterpunkten. Am Ende folgt eine Liste mit Action Items. Das sind die Art To-dos, die sich aus der Diskussion ergeben.

Was den Preis angeht: Beim kostenlosen Account und Plus-Preisplan für zehn US-Dollar gibt es nur einen Vorgeschmack der KI-Features – nebst dem KI-Aktuar gibt es einige weitere Features wie die KI-Suche, einen Agenten und den Research Mode. Um sie zu nutzen, brauchen wir mindestens den Business-Account für zwanzig US-Dollar pro Nutzer und Monat.

Fazit: Toll, aber!

Wir sehen: Eine auf Effizienz getrimmte Herangehensweise, die ohne Zweifel auch Nachteile hat: Wenn jeder Piep am Schluss im Protokoll landet, besteht die Gefahr, dass die unbeschwerte Kreativität und die Freiheit, offen heikle Dinge anzusprechen, auf der Strecke bleibt. Die lückenlose Dokumentation steht im Widerspruch zu Freestyle-Diskussionstechniken, zu denen ich freies Assoziieren, das Ausloten nebensächlicher Facetten und das Zulassen unausgegorener Hirnfürze zählen würde – ebenso Konfrontationen, wie sie manchmal unvermeidlich sind. So eindrücklich ich die Transkription technisch finde, so deutlich spüre ich, dass meine persönliche Management- und Sitzungskultur eine andere wäre.

Beitragsbild: Achtung, auch der blöde Witz landet im Protokoll (Anna Shvets, Pexels-Lizenz).

Ein Kommentar zu «Nie wieder Sitzungsprotokolle!»:

  1. Ich ärgere mich jeweils masslos, wenn mir jemand nach einer Besprechung eine von der KI erstellte Zusammenfassung schickt.

    Ja, die Systeme verstehen mittlerweile auch Mundart erstaunlich gut. Aber sie verstehen den Inhalt nicht.

    Der Zweck eines Protokolls ist es, wesentliche Punkte der Diskussion und besonders die gefassten Entschlüsse festzuhalten. Das kann eine KI nicht, und auch nicht jeder Mensch. Ich bin jedenfalls froh, dass wir im Verein eine kompetente Aktuarin haben, welche kurze, aber präzise Protokolle schreibt.

Kommentar verfassen