Bing: Liefern statt lafern!

Für die Nichtschweizer: Der Titel bedeutet, keine Reden zu schwingen, sondern zu handeln. Da Micro­soft seinen Bing-Chat-Assis­tenten in Windows inte­griert hat, wollte ich heraus­finden, ob er auch dabei hilft, Windows-Probleme zu lösen.

Neulich wollte die Windows Studio-Effekte ausprobieren: Das sind Modifikationen, die das Betriebssystem am Live-Kamerabild vornimmt. Windows 11 kann den Hintergrund unscharf rechnen, die Pupillen so anpassen, damit es aussieht, als würden wir direkt in die Kamera blicken (Augenkontakt) und automatisch auf die Person vor der Kamera zoomen und ihr folgen, während sie sich bewegt (Automatische Umrandung). Die Funktion Sprachfokus sollte die Sprecher-Stimme besser von den Umgebungsgeräuschen trennen.

Die Funktion müsste in den Einstellungen bei Bluetooth und Geräte unter Kameras zu finden sein, doch bei meinem Computer ist dort nichts zu wollen: Keine der Optionen tauchen dort auf.

Das hat mich auf eine Idee gebracht: Statt selbst lange im Netz zu recherchieren, woran das liegen könnte, frage ich Bing Chat. Das ist naheliegend: Denn wenn Bings digitaler Assistent nicht über Microsofts Betriebssystem Bescheid weiss, dann wäre das hochnotpeinlich.

Also, frage ich Bing Chat, wie ich zu diesen Studio-Effekten komme. Er teilt mir mit, ich müsse «Windows 11 Build 22621.1344 oder höher ausführen». Und er erklärt, es brauche eine Neural Processing Unit (NPU).

Das ginge auch kürzer

Ist das schon KI-splaining?

Ich stelle die naheliegende Frage: «Hat mein Computer eine NPU?» Bing:

Eine Neural Processing Unit (NPU) ist eine spezielle Hardware, die bestimmte maschinelle Lernaufgaben beschleunigt, wie z.B. Computer-Vision-Algorithmen. Eine NPU ist für IoT AI konzipiert und umfasst Module für Multiplikation und Addition, Aktivierungsfunktionen, 2D-Datenoperationen, Dekompression usw. Um zu überprüfen, ob Ihr Computer eine NPU hat, können Sie die Systeminformationen oder den Geräte-Manager öffnen und nach einem NPU-Gerät suchen. Wenn Sie keins finden, bedeutet das wahrscheinlich, dass Ihr Computer keine NPU hat.

Die kürzere Antwort wäre natürlich gewesen: «Nein».

An dieser Stelle ist ein erstes Fazit fällig, das durchzogen ausfällt. Als positiv ist zu vermerken, dass Bing mir ohne grossen Aufwand die richtige Information gegeben hat: Das war einfacher, als wenn ich mich selbst hätte durch Supportdokumente hätte wühlen müssen. Es gibt aber einen dicken Tolggen im Reinheft: Bing hat nicht einfach selbst nachgesehen, ob auf meinem Computer eine NPU vorhanden ist. Stattdessen musste ich das selbst tun.

Das Rad wird mal wieder neu erfunden

Das ist schwach, angesichts der Erwartungen, die Panos Panay geweckt hat. Das ist der Windows-Chef bei Microsoft, der neulich ein riesiges Fass aufgemacht hat. Er hat von einem «wichtigen Windows-Update» gesprochen, bei dem «das neue, KI-gestützte Bing in die Taskleiste» integriert werde:

Das grosse Update für Windows 11, das ich heute mit Freude vorstelle, wird diesem neuen Zeitalter der KI gerecht. Wir erfinden die Art und Weise neu, wie Menschen Aufgaben an ihren PCs erledigen.

Ein neues Icon reicht, damit aus einem Windows-Upate ein «grosses» Windows-Update wird.

Ich habe meine Frage zu den Studio-Effekten und der NPU natürlich via Windows-Taskleiste bzw. über das Suchfeld des Betriebssystems gestellt – in der Erwartung, dass Bing in der Lage ist, selbst Nachforschungen auf meinem Computer anzustellen. Doch was ist passiert? Es ist automatisch der Edge-Browser aufgegangen, wo ich meine Frage noch einmal eintippen durfte.

An dieser Stelle wird klar, dass Panos Panay unterschiedliche Vorstellungen davon haben, was die «Integration» einer Funktion in Windows bedeutet: Ich stelle mir darunter eine enge Vernetzung vor, die es dieser neuen Funktion erlaubt, mit dem Betriebssystem gezielt zu interagieren. Für Panos Panay seinerseits ist eine «Integration» gegeben, wenn das Icon von «Bing Chat» im Suchfenster zu sehen ist.

Was für eine dreiste Übertreibung!

Wir kommen zum Schluss, dass hier wahnsinnig viel Schaumschlägerei mit im Spiel ist: Das ein «wichtiges Update» zu nennen, ist dreist – zumal Windows auch vorher schon Bing-Resultate in diesem Suchfeld angezeigt hat. Und eine der Errungenschaften der Vergangenheit eine digitale Assistentin namens Cortana war.

Microsoft hat eine Chance verpasst: Eine echte Integration von Bing Chat ins Betriebssystem würde tatsächlich eine neue Ära des Computings einläuten: Auf die Frage, warum der Computer heute so langsam ist, könnte Bing nachsehen, welcher Task den Prozessor in Beschlag nimmt und eine konkrete Empfehlung aussprechen: «Der Computer aktualisiert gerade den Suchindex. In etwa zehn Minuten wird diese Aufgabe beendet sein und dann steht wieder die volle Rechenkapazität zur Verfügung.»

Oder noch besser – wir könnten einer wirklich integrierten KI auch gleich Aufträge erteilen: «Welches sind Dateien über einen GB, die ich seit mehr als drei Jahren nicht mehr benutzt habe? Bitte verschiebe sie mir auf die externe Festplatte!»

Davon ist nicht die Rede. Zumindest bis jetzt – vielleicht kommt Panos Panay ja selbst noch auf den Trichter.

Jedenfalls ist die Frage nicht abschliessend beantwortet, wie gut Bing als Kummerbox-Onkel ist. Dieser Frage werde ich mich künftig hier im Blog immer mal wieder widmen … Den Auftakt macht den Beitrag Schau mal auf den Kalender, Bing!.

Beitragsbild: Bing – Symbolbild (Nick Fewings, Unsplash-Lizenz).

2 Kommentare zu «Bing: Liefern statt lafern!»

  1. Hi!

    Das basiert auf der Fehlannahme, ein Sprachmodell sei eine umfassende künstliche Intelligenz (KI). Man kann das auch mit ChatGPT direkt testen, es ist nicht möglich ein Sprachmodell über aktuelle Kontexte zu sprechen. Was immer wieder flach gemacht wird, ist zum Beispiel ChatGPT zu fragen, was sie vom Inhalt hinter der URL xyz sagt. Im besten Fall (ChatGPT 4 macht das nun recht gut), bekommt man als Antwort, dass ein Sprachmodell nicht auf aktuelle Informationen, sondern Antworten nur auf gelernte Informationen bis unter anderem September 2021 zurückgreifen kann.

    Das sind natürlich nicht nur URLs. Das sind auch Hardwareinformationen des eigenen Rechners, die können nie gelernt worden sein.

    Maschinelles Lernen und Deep Learning sind ein „supporting area“ der KI. Sie produzieren belernte neuronale Netzwerke, die mittels Mustererkennung zu Input passenden Output liefern.

    Webseiten hinter URL oder wie in diesem Fall Hardwareinformationen, sind Roh-Inputdaten, die keine Entsprechungen zu Ausgabedaten haben. Im schlimmsten Fall ratet (halluziniert) das Sprachmodell aus dem Kontext der vorherigen Informationen und den Teildaten aus der Referenz (bei URLs etwa die Wörter aus dem URL-Pfad).

    Man könnte jetzt erwarten, dass bestimmte Referenzangaben selbst so etwas, wie eine Frage sind und man Hilfsprogramme hat, die Fragen (und nicht Input) an das Sprachmodell stellen. Also man fragt: Hat meine Hardware NPU? Die Frage geht nicht an das Sprachmodell, sondern zunächst an eine andere Funktion, die Daten der lokalen Hardware ermittelt und daraus eine Frage für das Sprachmodell generiert, wie: Hallo Bing, nach einer Analyse wurde nicht festgestellt, dass ein Gerät namens NPU nicht existiert, warum funktioniert Windows-Studio-Effekte nicht?

    Und genau diese Kombination ist eben nicht trivial, denn die Problematik ist, wie schafft ein anderes Modell jedoch deinen Kontext mit den Hardwareinformationen zu so einer richtigen Frage zusammenzusetzen, dass deine Ursprungsfrage erhalten bleibt. Im besten Fall reichen die typischen Verkettungsfragen mit Frage und Akzeptanzkriterien zur Eingrenzung.

    Wie man sieht, hat das Microsoft aber Ganzen nicht implementiert. Es fehlt einfach ein Baustein.

    Beste Grüße
    Aljoscha

    1. Danke für den Kommentar. Mir ist schon klar, dass solche Sprachmodelle nicht wirklich intelligent sind. Aber so weit ich die Sache durchdrungen habe, wäre es absolut möglich, Bing lokal zu betreiben und anhand konkreter Systeminformationen zu trainieren, damit sie Aussagen zu meinem PC treffen kann. Vergleiche die hier auch schon besprochenen magischen Avatare, die eben nicht irgendjemanden zeigen, sondern mich, weil sie anhand meiner Selfies trainiert worden sind.

Kommentar verfassen