Ein Laptop mit zwei Bildschirmen. Auf der linken Seite ist ein Hintergrundbild mit einem Sonnenuntergang und auf der rechten Seite eine Eingabemaske für eine Anwendung. Daneben steht eine Kaffeemaschine.
Um diese Firefox-Neuerung zu verdauen, wird der eine oder andere User erst einmal einen starken Espresso brauchen. Links das «Classic Window» mit der Tabliss-Erweiterung, rechts das neue «Smart Window» mit KI.

Ein erster Eindruck vom Smart Window in Firefox

In Firefox zieht mit dem «Smart Window» ein KI-Modus ein, der Such­re­sul­tate zu­sam­men­fasst, Rei­ter­in­halte ver­gleicht und die Chronik ana­ly­siert. Ein erster Test zeigt in­te­res­san­te Ansätze, aber auch einen ek­la­tanten Mangel beim Daten­schutz. Ob Mo­zil­las KI-Strategie auf­geht, bleibt offen.

Die künstliche Intelligenz ist für Mozilla eine Herausforderung:

  • Auf der einen Seite gibt es die Techkonzerne. Sie statten ihre hauseigenen Browser in bewährter Bündelungsmanier mit ihrer KI aus, um den Lock-in-Effekt für die Kundschaft zu vergrössern.
  • Auf der anderen Seite soll und muss Firefox eine Ausweichmöglichkeit für Leute mit einem ausgeprägten Sinn für Unabhängigkeit bleiben.

Ich zähle mich zu diesem zweiten Kreis: Ich will keinen Chrome-Browser, bei dem ich automatisch Gemini benutzen muss. Das gleiche gilt für Atlas und ChatGPT und für Comet und Perplexity.

Aber wo soll Mozilla die Grenze ziehen? Ein skeptischer Anteil der Nutzerinnen und Nutzer verlangt lautstark, Firefox müsse KI-frei bleiben. Ich gehöre zu denen, die aus KI einen Nutzen ziehen und den Browser nicht ausklammern wollen. Aber ich will selbst über die Kombination von Sprachmodell, Browser und Einsatzgebieten entscheiden. Mozillas Weg scheint mir bislang nicht verkehrt: Es gibt inzwischen einen «KI-Killswitch», um die KI komplett zu deaktivieren.

Ein erster Blick durchs smarte Fenster

Dropdown-Menü in einer Anwendung mit Optionen «Classic Window» und «Smart Window (BETA)». Das Menü ist in einer dunklen Benutzeroberfläche eingebettet.
Zwischen den beiden Fenstern wechseln.

Die zweite Etappe in dieser «AI Journey» führt uns zum Smart Window (hier ursprünglich AI Window genannt). Das ist ein neuer Modus, in dem Firefox mit der künstlichen Intelligenz arbeitet, während er im Classic Window funktioniert, wie gehabt. Ich trug mich als Tester in die Warteliste ein. Letzte Woche tauchte das Feature auf.

Es findet sich in der rechten oberen Ecke des Programmfensters zwischen dem Knopf Alle Tabs auflisten und dem Minimieren-Button. Er schaltet zwischen dem klassischen und dem smarten Modus um, wobei der Wechsel für das aktuelle Fenster gilt. Wir können parallel Fenster als Classic Window und als Smart Window offen haben.

Bildschirmoberfläche mit drei Auswahloptionen: «Schnell» (schnelle Antworten), «Flexibel» (geeignet für die meisten Bedürfnisse) und «Persönlich» (massgeschneiderte Antworten). Schaltfläche «Weiter».
Beim «Onboarding» gibt man seine Vorlieben an. Das bestimmt, welches LLM zum Zug kommt.
Screenshot der Firefox-Einstellungen für die Funktion «Smart Window», die Optionen zum automatischen Öffnen und zur Auswahl verschiedener KI-Modelle zeigt.
In den Einstellungen lässt sich das Modell jederzeit ändern.

Beim ersten Start fragt uns die KI nach der Arbeitsweise und bietet Fast, Flexible und Personal als Optionen an. Die Auswahl beeinflusst das Sprachmodell, das Firefox benutzt. Man kann das nachträglich in den Einstellungen ändern, und zwar bei KI-Einstellungen unter Smart Window settings. Wir sehen hier, welche Modelle hinter den entsprechenden Optionen stecken:

  1. Fast
    Gibt schnelle Antworten mit Gemini-2.5-fiash-lite von Google
  2. Flexible
    Das ist eine gute Wahl für die meisten Bedürfnisse (Qwen3-235B-A22B-lnstruct-2507 von Alibaba)
  3. Personal
    Gibt die individuellsten Antworten (Gpt-oss-1203 von OpenAl)
  4. Und Custom
    Nimm dein eigenes LLM.

Bei der vierten, individuellen Variante binden wir über eine Adresse ein eigenes Sprachmodell ein, das im Netz oder auf dem gleichen Computer läuft. Wie das geht, beschreibe ich ausführlich.

Beim Wechsel zum Smart Window wird das Fenster in eine violette Atmosphäre getaucht. Das ist, na ja, Geschmackssache. Im Zentrum steht ein Eingabefenster, das Internetadressen oder auch Prompts entgegennimmt.

Screenshot einer Google-Suchseite, die Artikel über die Entlassungen bei Meta anzeigt. Mehrere Medien berichten über die Kürzungen und deren Auswirkungen auf die Mitarbeitenden.
Der erste Test ist bestanden: Die KI im «smart Window» fasst die Suchresultate zusammen.

Das sieht aus wie das Eingabefeld von ChatGPT oder dem KI-Modus von Google, aber es funktioniert nicht genauso. Eine Rechercheanfrage («Wie haben deutsche Medien über die Entlassungen bei Meta berichtet?») bewirkt mit der Einstellung Ask nichts. Schalten wir über das Kontextmenü auf Search with Google Schweiz (sic) um, dann erscheinen die klassischen Suchresultate. Der KI-Prompt rückt nach rechts unten und erlaubt es uns nun, mittels LLM mit den Suchresultaten zu arbeiten.

Die KI führt selbst keine Aktionen aus

Ich probiere es mit einer einfachen Aufgabe: «Fasse mir diese Resultate zusammen.» Und in der Tat liefert die KI eine gegliederte Übersicht. Sie bezieht sich nur auf die Anrisse auf der Seite mit den Suchtreffern. Es gibt keine agentische Aktion, die uns die Arbeit abnehmen würde, die relevanten Artikel selbst zu sichten.

Als Nächstes wollte ich in meinem Testlauf herausfinden, welche Erkenntnisse die KI aus meinen Bankdaten zieht. Neulich hatte ich das mit einem lokalen Modell ausprobiert, aber festgestellt, dass das zu wenig leistungsstark für echte Erkenntnisse ist. Ich loggte mich bei der ZKB ein und wollte eine Analyse meiner Ausgaben haben. Doch sowohl Gpt-oss-1203¹ als auch Qwen² verweigerten die Analyse. Die Fehlermeldung lässt den Schluss zu, dass Mozilla die Übergabe dieser heiklen Daten unterbindet.

Warum? An dieser Stelle musste ich feststellen, einem Grundlagenirrtum aufgesessen zu sein: Meine Annahme war, dass diese Modelle lokal im Browser laufen – schliesslich ist die sogenannte geräteinterne KI eine der Stärken von Firefox. Das das nicht der Fall ist, lässt sich jedoch nur indirekt herausfinden: im Supportdokument Ist das Smarte Fenster sicher und privat? steht, dass die Informationen über den Mozilla-Proxy an den KI-Betreiber übermittelt werden und im Beitrag zur Modellauswahl ist zu lesen, die Betreiber würden die Informationen nur kurzfristig speichern.

Ein Dämpfer: diese Sprachmodelle laufen in der Cloud!

Bild zeigt eine Benutzeroberfläche mit Optionen für den Smart Window, der aus Chats und Browsing lernt. Es sind Einschaltkästchen für «Chats in Smart Window» und «Browsing across Firefox» sichtbar.
«Private by Design»? Dieses Versprechen bedeutet nicht, dass keine Cloud involviert wäre.

Das ist, natürlich, ein massiver Dämpfer. Erstens fällt das Argument des Datenschutzes weitgehend weg. Es lässt sich zwar argumentieren, dass der erwähnte Proxy die Zuordnung der Anfragen zu einzelnen Nutzern vermutlich nicht verunmöglicht, aber zumindest erschwert. Aber natürlich ist diese Methode weit davon entfernt, einen Cloud-Skeptiker zu überzeugen. Auch mir geht es so: Eine lokale KI, die ich ohne Bedenken nutzen kann, wäre ein starkes Argument für das Smart Window. Wenn meine Anfragen an Qwen bei Alibaba landen, kann ich gleich bei ChatGPT bleiben.

Es gibt einen einleuchtenden Grund, warum Mozilla diese Lösung wählte. Aufgrund meiner Erfahrungen mit lokalen LLMs ist es plausibel, dass die einfach nicht die Leistung liefern, die für eine einigermassen konkurrenzfähige Nutzung notwendig wäre. Das erwähnte Modell von Qwen ist um die 438 GB gross – das passt nicht auf den Laptop. Mit den kleineren Modellen erzielte man die gewünschten Resultate schlicht nicht.

Trotzdem: Es ist stossend, dass dieser Umstand und die Beteiligung der Cloud nicht unmissverständlich deklariert werden. Bei der Aktivierung erfolgt der Hinweis, das Smart Window sei private by design. Ich habe mich zwar darüber gewundert, dass kein längerer Modell-Download stattfand, meine Annahme aber nicht hinterfragt.

Fazit: Der Weg ist noch weit und es ist unklar, ob die Richtung stimmt

Alt-Text: Übersichtstabelle mit Informationen über zwei Artikel zur aktuellen Lage in Kuba. Themen sind humanitäre und wirtschaftliche Krisen sowie militärische Vorbereitungen.
Durch Auswahl mehrerer Reiter, lassen sich Webseiten vergleichen.

Die Implementation leuchtet ein: Im Eingabefenster ist ersichtlich, welche Informationen die KI bei ihrer Antwort berücksichtigt: Es ist standardmässig der geöffnete Reiter, aber über das Plus-Symbol werden mehrere Websites in eine Antwort einbezogen. Auf diese Weise lassen sich Artikel oder auch Shop-Angebote vergleichen. Die Antworten lassen sich über das Kopieren-Symbol im Markdown-Format abgreifen und bei Bedarf neu generieren.

Über den Knopf neben dem Plus-Symbol werden die Memories, d. h. die über den User gespeicherten Angaben aus der Chat-Historie benutzt oder ignoriert.

Es zeigt sich an allen Ecken und Enden, wie limitiert Mozillas Ansatz ist:

Es kommt oft vor, dass die Modelle eine Auskunft verweigern. Nicht nur bei Bankdaten, wo die Gründe einleuchten, sondern auch in banalen Situationen. Ich liess mir den Quellcode einer Webseite anzeigen und bat die KI um eine Aufzählung der verwendeten Schriften: kein Resultat, stattdessen eine Anleitung, wie ich selbst via Entwicklerwerkzeuge nachforschen könne. Vermutlich liefert Mozilla die Seite nicht vollständig ans Sprachmodell, sondern verwendet eine datensparsame Form, in der diese Information nicht enthalten ist. Dafür mag es Gründe geben, aber es schmälert den Nutzen deutlich.

Ich beobachtete häufig Darstellungsfehler. Statt korrekt formatierter Texte erschien Markdown-Syntax. Das dürfte ein behebbares Problem sein, aber es zeigt, dass das Smart Window einen weiten Weg vor sich hat.

Zwischen Stuhl und Bank

Screenshot einer Analyse des Surfverhaltens der letzten drei Tage in einem Webbrowser. Übersicht über besuchte Webseiten und Suchanfragen. Die Benutzeroberfläche ist in dunklen Farben gehalten.
Diese Analyse ist lückenhaft; für eine ausführlichere Antwort müssten wir in der Chronik weiter nach unten scrollen.

Unter dem Strich überzeugt mich der Ansatz nicht: Einerseits sind die Modelle zu gross, um lokal zu laufen. Andererseits sind sie doch so langsam, dass sie nicht mit den Dickschiffen mithalten können, die ich normalerweise benutze. Daher kommt die KI à la Mozilla für Recherchen bei mir nicht zum Zug.

Ich sehe jedoch einen praktischen Nutzen bei der Interaktion mit dem Browser selbst. Beispiel: Über die Firefox View öffne ich die Chronik und verlange eine Analyse meines Seitenverlaufs der letzten drei Tage. Die fällt ordentlich aus. Die Aufforderung, meine Reiter zu sortieren, führt zu einer alphabetischen Liste aller geöffneten Webseiten. Natürlich wäre es mir lieber gewesen, die Reiter wären thematisch gegliedert worden – und das in echt und nicht bloss in Textform.

Ob das reicht? Ich habe meine Zweifel. Aber ich sehe jetzt deutlich die Notwendigkeit für einen Heimserver, der zumindest ein mittelgrosses LLM von einem halben Terabyte lokal ausführen kann …

Fussnoten

1) Der Wortlaut der Meldung von Gpt-oss:

I’m unable to retrieve the contents of the banking overview you referenced, so I can’t categorize the expenses for you. If you can provide the list of expenses (or a copy of the page’s text), I’ll be happy to organize them into categories.

2) Der Wortlaut der Fehlermeldung von Qwen:

I can’t access the content of the eBanking page from Zürcher Kantonalbank due to security restrictions — I’m unable to retrieve the transaction details or categorize the expenses for you.

Kommentar verfassen