Im Sommer ging Perplexity mit Comet an den Start. Aus dem Juni stammt Aria, die in Opera integrierte KI. In Firefox gibt es erste Anzeichen eines Sprachmodells. Die Macher von Arc wollen mit Dia ein Stück des Kuchens ergattern. Und auch Microsoft und Google sind nicht untätig. Es ist unverkennbar, dass der Hype um die künstliche Intelligenz voll auf den Browsermarkt durchschlägt.
Und jetzt OpenAI: Der KI-Überflieger stellte am Dienstag Atlas vor. Diese vorerst für den Mac erhältliche Anwendung will uns das Web ChatGPTs Hilfe erschliessen. Keine Frage, dass mich interessiert, wie gut sie das tut – und ob sie mit den vielen Konkurrenten mithalten kann.
Der erste Eindruck: ein sehr minimalistisches Programm. Atlas basiert auf Chromium, stellt aber nur eine Untermenge von dessen Funktionsumfang zur Verfügung. Das Dreipunkt-Menü am Ende der Symbolleiste fehlt, ebenso die Reitergruppierung, die Profile und viele Einstellungen, namentlich zum Datenschutz. Damit lassen sich bereits vor dem Praxistest zwei Dinge festhalten:
- Atlas ist derzeit eine Technologiedemo (POC), aber kein echter Ersatz für einen ausgereiften Browser, sei es Chrome, Firefox oder Safari.
- Der Ansatz, die KI direkt mit dem Browser zu verschmelzen, ist vom falschen Ende her gedacht. Aus Sicht von uns Nutzerinnen und Nutzern wäre es besser, sich auf Standardschnittstellen zu einigen, über die Sprachmodelle und Anwendungsprogramme zusammenkommen.
Eine Ergänzung dazu, weil in den sozialen Medien eine Diskussion darum entstand: Dieser zweite Punkt ist aus Datenschutzgründen wichtig. Die Möglichkeit, über eine Schnittstelle ein lokales Sprachmodell einzubinden (wie hier für Thunderbird beschrieben) wird für mich ausschlaggebend sein, auf welche Lösung ich dereinst definitiv setze.
Jetzt aber zu den konkreten Resultaten:
1) Einen Blogpost aufspüren
In Atlas erscheint ChatGPT auf der Startseite bzw. in jedem neuen Reiter – was sich nicht abändern lässt. Das Sprachmodell hat Zugriff auf die geöffnete Seite. Bei einem ersten Test soll mir ChatGPT den neuesten Beitrag aus diesem Blog hier heraussuchen, der sich mit der Computerhistorie beschäftigt. Die KI liegt mit ihrer ersten Nennung (meiner Besprechung der Netflix-Serie «The four seasons») völlig daneben. Richtig ist die nächste Idee: «Um das genaue Datum zu nennen, müsste man die Kategorie Computer-Historie öffnen». Auf meine Aufforderung hin, er solle das tun, passiert das tatsächlich und ChatGPT gelangt zur korrekten Antwort.
2) Den Kalender analysieren
So ermutigt, öffne ich meinen Google-Kalender, blende meine beruflichen Termine ein und bitte ChatGPT, jene Sitzungen zu identifizieren, die ich am ehesten schwänzen könnte. Die Analyse kommt prompt und ist einwandfrei.

3) Überflüssige Newsletter abbestellen
Nächster Versuch: Das Gmail-Konto aufräumen. Ich stelle ChatGPT die Aufgabe, nach Newslettern zu suchen, die «nichts mit meinem Job als Computerjournalist zu tun haben und die mir mindestens zweimal pro Woche zugeschickt werden». Er versteht das falsch und macht Vorschläge zu entsprechenden Aussendungen, die ich abonnieren könnte. Ich stelle das richtig.
Obwohl mein Mailkonto im Browser geöffnet ist, zeigt ChatGPT mir die Aufforderung an, eine Verbindung mit Gmail herzustellen. Das ist auch mit der Webversion des Sprachmodells über die sogenannten Connectors möglich. Ich unternehme einen zweiten Versuch, doch auch via Connector nennt ChatGPT fast die gleichen Kandidaten. Damit der alte Kontext nicht in die Quere kommt, starte ich einen neuen Chat und gebe ChatGPT die gleiche Aufgabe noch einmal. Der Chatbot behauptet nun, er habe «keinen direkten Zugriff auf mein Gmail-Konto». Ein dritter Versuch, wiederum mit geöffnetem Gmail: «Ich konnte in deinem Gmail-Postfach keine Nachrichten mit dem Label Newsletters finden.»

Ich lasse es gut sein.
4) Beim Shopping helfen
Wie gut ist die KI als Shopping-Helfer? Kann sie dabei helfen, ein Angebot zu beurteilen und günstigere Bezugsmöglichkeiten zu finden?
Ein Testlauf mit Microsofts Browser Edge endete in einer Enttäuschung. Dort gibt es die brandneue Funktion Copilot Vision, mit der wir uns per Sprache mit der KI über eine Website unterhalten. Für die Sonntagszeitung wollte ich herausfinden, ob mich Copilot davor bewahrt, für eine (bereits gekaufte) Webcam zu viel Geld auszugeben. Doch da Edge keine agentischen Fähigkeiten hat, war die künstliche Intelligenz im Browser nicht in der Lage, einen Preisvergleich durchzuführen.

ChatGPT hingegen zuckt nicht mit der Wimper und meldet zurück, dass es die Kamera mehr als fünfzig Franken günstiger gibt. Auch der offizielle Verkaufspreis wird genannt.
Das lässt sich als Blamage für Microsoft oder als Triumph für Atlas interpretieren. Auf die Gefahr hin, für 140 Franken eine zweite, nicht benötigte Webcam auszugeben, bitte ich den Chatbot, mir die Kamera zu kaufen, wenn sie für 140 Franken bei einem meiner Lieblingshändler verfügbar ist. Darauf will er sich nicht einlassen. Aber ich wette, dass wir spätestens in einem Jahr auf diese Weise Online-Shopping betreiben werden.
5) Faktencheck und Medienkompetenz (siehe Beitragsbild)
Bei einem zweiten Arbeitsauftrag machte Microsoft Copilot Vision keine gute Falle. Meine Bitte um eine Beurteilung der Website von RT DE führte zu oberflächlichen Aussagen ohne jegliche Hinweise auf die politische Schlagseite. Dabei ist im Edge-Browser seit Jahren Newsguard eingebaut. Das ist eine Initiative gegen Falschmeldungen, die Newsportale systematisch anhand eines klaren Kriterienkatalogs beurteilt. RT gilt als einer der grössten Verbreiter von Fakenews, was Newsguard klar dokumentiert (falls unter dem Link nichts zu sehen ist, bitte mit MS Edge öffnen).
Ich bitte ChatGPT um einen Faktencheck eines Artikels zur UBS. Er fällt differenziert aus:
Die Meldung enthält viele faktische Kernelemente (Übernahme, AT1-Abschreibung, Gerichtsurteil) und basiert auf realen Ereignissen. Daher ist sie grundsätzlich glaubwürdig in ihrer Darstellung der Grunddaten. Allerdings:
- Der Artikel gehört zu RT Deutsch, einem Medium mit klarer politischer Ausrichtung, was eine kritische Einordnung verlangt.
- Der überspitzte Sprachstil und die starke Formulierung («Macht», «enteignet», «Spielplatz für Grossbanken») weisen auf eine wertende Perspektive hin.
- Einige Aussagen über Absichten und Machtmechanismen sind eher interpretativ als dokumentiert.
Das ist eine handfeste Hilfe bei der Einordnung und ein tatkräftiger Beitrag zur Medienkompetenz – abrufbar mit einem kurzen Prompt direkt beim Surfen. Jetzt müssten sich nur noch die richtigen Personen dafür entscheiden, diese Möglichkeit auch zu nutzen.
6) Wordpress administrieren
Ich halte inzwischen grosse Stücke auf die ChatGPTs Fähigkeiten, mir bei der Betreuung meiner Websites zu helfen. Ich versuche es daher mit der Aufgabe, an der der Comet-Browser von Perplexity noch gescheitert war. Die KI soll die installierten Plug-ins überprüfen und alle deaktivieren, die in den vergangenen zwölf Monaten kein Update erfahren haben.
ChatGPT fragt nach:
Das kann ich nur ausführen, wenn ich deinen Browser aktiv verwende – also direkt in deinem Wordpress-Dashboard klicken darf.
Auf die Gefahr hin, ein Backup wiederherstellen zu müssen, gebe ich die Erlaubnis. Es erscheint eine Aufklärung zum Agentenmodus, in dem ich auf die Option Angemeldet starten klicken muss – was ich mit einem unguten Gefühl tue. Daraufhin aktiviert ChatGPT den Agentenmodus und geht systematisch daran, die Aufgabe auszuführen. Da im Backend nur die Versionsnummer, nicht aber das Datum der letzten Aktualisierung ersichtlich ist, muss ChatGPT via Details anzeigen die entsprechende Seite im Plug-in-Verzeichnis öffnen und die Information dort nachschlagen.

Nach drei Minuten erscheint das Resultat: ChatGPT hat zwei Module abgeschaltet: Compact Archives, dessen letzte Aktualisierung ein Jahr her ist, sowie das Advanced Random Posts Widget, das zwei Jahre alt ist.
Nun bin ich beeindruckt! (Trotzdem reaktiviere ich das Advanced Random Posts Widget, weil mir das Risiko vertretbar scheint.)
Fazit: OpenAI zeigt, wohin die Reise geht
Nur ein paar Tage, nachdem Microsoft grosse KI-Ankündigungen machte, kommt OpenAI mit Atlas um die Ecke. Nach meinem ersten Augenschein bin ich beeindruckt. Zwar hat Atlas nicht bei allen Aufgaben brilliert. Im Gegenteil: Selbst bei einfachen Aufgaben brauchte er Hilfe oder Extra-Zuspruch.
Dennoch tut sich ein Tummelfeld an Möglichkeiten auf. Eine KI, die direkt mit Web-Anwendungen und den persönlichen Daten interagiert, ermöglicht beträchtliche Zeitersparnisse und öffnet Anwendungsbereiche, die vorher aufgrund zu hoher Einstiegshürden nie infrage gekommen wären. Und klar: Der Agentenmodus dürfte noch schneller werden und – so wäre es aus Datenschutzgründen am besten – lokal und nicht remote agieren.
Trotzdem: Wir stehen erst am Anfang einer spannenden Reise!
