Mit den Tasks führt ChatGPT Aufgaben zeitgesteuert aus. Mich überzeugt das bislang nicht. Bei den Google Workspace Flows ist das anders. Ich bin ein Fan von Automatisierungsmöglichkeiten. Und in diesem Feld eröffnen sich neue Möglichkeiten.
Zuerst zu den Grundlagen: Es handelt sich um Agenten in Google Workspace. Weniger technisch ausgedrückt: Autonom agierende Softwaremodule führen in der Umgebung mit den Geschäfts-Apps Aktionen aus. Es braucht einen Starter, der den Agenten in Bewegung versetzt. Und natürlich eine klare Vorgabe, welche Aktionen er ausführen soll.
1) Die Ausgangslage
Google kündigte die Flows im April auf der Next-Konferenz an. Seit zwei Wochen tauchen sie bei Nutzerinnen und Nutzern auf. Ich sah sie Ende letzter Woche zum ersten Mal im Geschäfts-Account meines Arbeitgebers, und hatte seitdem Zeit für einige Experimente. Falls ihr es selbst ausprobieren wollt: Ihr braucht einen Bezahl-Account und Zugang zum Gemini-Alpha-Programm.

Falls das gewährleistet ist, richtet ihr unter flows.workspace.google.com eure Agenten ein. Unter Discover finden sich eine Menge vorgefertigter Helferlein, die sich für eigene Zwecke adaptieren lassen. Sie geben einen Eindruck davon, was möglich ist. Und sie lassen erahnen, wo die Grenzen liegen.
2) Auslöser: Den Agenten in Gang versetzen
Wir können uns von Gemini einen Agenten bauen lassen – natürlich. Aber um uns einen Überblick der Möglichkeiten zu verschaffen, ist es sinnvoller, selbst Hand anzulegen. Das tun wir via Plus-Symbol. Als Erstes wählen wir einen Starter; neudeutsch würde man auch von einem «Trigger» sprechen. Das ist das Ereignis, das den Agenten in Aktion versetzt.
Wie der Screenshot zeigt, hält Workspace ein Dutzend solcher Auslösrvor:

Der naheliegendste ist der Zeitplan (Schedule). Auch ein neues E-Mail kann einen Agenten auslösen, wobei wir die Möglichkeit haben, auf alle Nachrichten zu reagieren oder auf einen bestimmten Absender oder einen spezifischen Wortlaut zu achten. Vor allem letzteres ist vielversprechend: Ein simpler Flow setzt uns darüber in Kenntnis, dass eine Nachricht zu einem wichtigen Thema eingetroffen ist.
Weitere Starter betreffen den Chat: Wir reagieren auf Erwähnungen, Nachrichten, Emoji-Reaktionen oder auf Neuankömmlinge in einem Gruppenbereich (Space). Auch Änderungen an Dokumenten und in der Dateiablage können Aktionen auslösen, ebenso neue Formularantworten. Mit der Option Based on a meeting führen wir Aktionen anhand von Kalendereinträgen aus. Es gibt die Option, eine bestimmte Sitzung oder die Option Every Meeting auszuwählen und die Aktion mit einem bestimmten Zeitversatz vor oder nach dem angesetzten Termin auszuführen.
Damit ergeben sich einige Einsatzmöglichkeiten, die sich vor allem für wiederkehrende Ereignisse anbieten: Wir lassen den Agenten vor einer Sitzung die Traktandenliste verschicken oder versenden hinterher eine auf dem KI-Sitzungsprotokoll basierende Aufgabenliste.
Gleichzeitig werden die Einschränkungen sichtbar: Die Starter sind nicht so spezifisch definierbar, wie wir es vielleicht gern hätten. Die Gästeliste und andere Elemente stehen nicht zur Verfügung. Das verwehrt uns die Möglichkeit, dem Kollegen Brahimowic (oder der Kollegin Rüdishüli), die jedes Mal fünf Minuten zu spät kommt, eine Extra-Einladung zu schicken.
Allerdings: Es gibt im weiteren Verlauf unseres Flows die Möglichkeit, auf spezifische Gegebenheiten einzugehen. Das ist mit einem Check-if-Schritt (siehe weiter unten) realisierbar.
3) Steps: Die Aktionen definieren

Haben wir den Auslöser festgelegt, dann fügen wir eine oder mehrere Aktionen (Steps) an. Das sind die eigentlichen Aufgaben, die der Agent erledigen soll. In vielen Fällen bietet es sich an, Gemini auf den Plan zu rufen (Ask Gemini) oder eine eigene spezialisierte Variante (Ask a Gem) zu involvieren.
Wir können konkret
- uns einen Überblick über die ungelesenen Mails verschaffen (Recap unread emails),
- Informationen extrahieren (Extract),
- Entscheidungen treffen (Decide) oder
- Zusammenfassungen erstellen lassen (Summarize).
Falls ihr euch fragt, was es mit den Entscheiden auf sich hat: Hier geht es darum, zu beschliessen, ob eine nachfolgende Aktion ausgeführt werden soll oder nicht. Beispiel: Wir sind in den Ferien und wollen von unserem Chef nur in Ausnahmefällen belästigt werden. Gemini soll anhand von Kriterien wie Dringlichkeit oder Überfälligkeit entscheiden, ob wir unserem Chef freundlich mitteilen, dass wir nicht verfügbar sind, oder stattdessen eine Benachrichtigung absetzen, die uns am Pool oder beim Skifahren aus unserer Entspannung reisst und darauf aufmerksam macht, dass unser Arbeitgeber leider nicht ohne uns auskommt.
Eine ähnliche Wirkungsweise hat die Überprüfung (Check if): Bei einem Termin überprüfen wir z. B. Titel des Meetings. Das ermöglicht uns, anhand eines bestimmten Stichworts zu entscheiden, ob die weiteren Schritte ausgeführt werden sollen oder nicht. Weitere Parameter sind die Beschreibung, allfällige Anhänge und der Besprechungsort, sowie die Link zu Notizen, Kalendereintrag und Videokonferenz.

Bei E-Mails gibt uns Check if Zugriff auf den Betreff, den Textinhalt, die ID, die Kategorie und die Adresse sowie den Klarnamen des Absenders. Anhänge und der Quellcode lassen sich nicht heranziehen.
Weitere Verfeinerungsmöglichkeiten gibt uns das Modul Filter. Es grenzt die Auslöser ein, die tatsächlich ausgeführt werden. Wenn unserem Ablauf ein E-Mail zugrunde liegt, hält der Filter die Variable Email attachments bereit. Sie erlaubt es uns, anhand von Dateiname oder -typ zu selektieren. Unser Agent könnte sich so auf PDFs von bestimmten Personen beschränken und die in Google Drive speichern.
Und eine echte Geheimwaffe ist der Schritt Send a webhook. Sie eröffnet uns einen Weg ins freie Netz und zu beliebigen Anwendungen, die sich mit dieser Methode steuern lassen. Nur ein Beispiel: Über die Rest-API von Wordpress oder ein passendes Plug-in liesse es sich einrichten, dass ein Mail von einem bestimmten Absender sofort im Blog veröffentlicht wird.
Zu den weiteren zur Verfügung stehenden Aktionen:
- Gmail:
Mails verschicken, eine Antwort entwerfen, eine Nachricht mit einem Label versehen, als gelesen markieren, als ungelesen markieren, mit Stern versehen, den Stern entfernen, weiterleiten oder archivieren. - Chat:
In einem Gruppenbereich posten, eine Nachricht senden, im Chat benachrichtigt werden. - Sheets: Eine Zeile einfügen, eine Zeile aktualisieren, eine Zeile löschen oder eine Tabelle abrufen.
- Drive:
Einen Mailanhang sichern, einen Ordner erstellen. - Kalender:
Einen Eintrag hinzufügen, Gäste zu einer Sitzung hinzufügen. - Docs: Eine Textdatei anlegen, etwas zu einem Dokument hinzufügen.
- Tasks:
Eine Aufgabe hinzufügen.
Des Weiteren stehen in den Flows Dritt-Apps zur Verfügung, namentlich Confluence, Jira, Mailchimp, Quickbooks und Salesforce.
Grenzen, Risiken und Nebenwirkungen
Fazit: Keine Frage, es steckt eine Menge Potenzial in den Flows. Das erschliesst sich uns Nutzerinnen und Nutzern nicht sofort: Ich hielt die Starter anfänglich für zu eingeschränkt, bis mir aufgegangen ist, dass sie erst in Kombination mit den Funktionen Check if und Filter ihr wahres Potenzial entfalten. Mir gefällt überdies, dass die Flows nicht ausschliesslich auf die künstliche Intelligenz setzen, sondern auch klassische deterministische Ansätze bereithalten: Filterungen und Entscheidungen lassen sich auch anhand «harter» Kriterien wie Dateinamen oder Titeln von Kalendereinträgen treffen.
Nach gut einer Woche des Experimentierens erlaube ich mir kein abschliessendes Urteil. Ich bin sicher, dass wir gerade bei ausgefalleneren Ideen schnell an Grenzen stossen werden. Es ist wie bei der Kurzbefehle-App von Mac, iPhone und iPad, die einige Ähnlichkeiten zu den Flows aufweist: Sie bringt uns auf Ideen für Workflows, die im Alltag nicht richtig funktionieren oder schnell an Grenzen stossen. Es würde mich nicht überraschen, wenn auch mit den Flows sich spezifische Ideen nicht realisieren lassen, weil ein bestimmter Parameter nicht zugänglich ist oder Gemini unsere Absichten zu wenig gut versteht oder keinen qualitativ ausreichenden Output liefert.

Einer meiner ersten Agenten ist dazu da, mir am Morgen eines jeden Arbeitstags eine Übersicht meiner E-Mails zu liefern. Er soll speziell auf die Mitteilungen von Arbeitskollegen achten, bei den Medienmitteilungen eine Triage nach Wichtigkeit vornehmen und die Newsletter nach herausragenden Neuigkeiten absuchen. Das funktioniert nicht schlecht und ist eine Arbeitserleichterung. Aber es ist nicht wegzudiskutieren, dass ich eine Aufgabe delegiere, die ich selbst erledigen müsste – zumindest dann, wenn ich mir sicher sein will, dass sie nach meinen Kriterien und Vorlieben erledigt wurde.
Darum bleibt es dabei: Im Idealfall spart die KI Zeit mit einer lästigen Routinearbeit. Aber die Verantwortung, dass nichts Wichtiges übersehen wurde, verbleibt weiterhin bei uns selbst. Ausserdem stellte ein Arbeitskollege fest, dass die KI in bestimmten Situationen, die sie (auch aus nichtigen Gründen) als heikel erachtet, die Ausführung verweigert: Das beeinträchtigt die Zuverlässigkeit.
Beitragsbild: Schon klar, wer hier den Durchblick hat (Vitaly Gariev, Unsplash-Lizenz).