Wenn ChatGPT ja nichts Falsches sagen will

Bei ChatGPT gab es Ende September einige bemerkenswerte Neuerungen: Das Sprachmodell lernte «hören» und «sprechen», sodass wir eine Art «Gespräch» mit der Software führen können. Ja, viele Anführungszeichen, denn dieser Dialog fühlt sich bisher nicht shr natürlich an.

Aber ich halte es für einen Meilenstein in der Art und Weise, wie Mensch und Maschine interagieren: Ich kann mir gut vorstellen, dass es in ein paar Jahren normal ist, mit Chatbots Konversationen zu führen, um Informationen zu erfragen oder sich zu unterhalten.

Was sagt die KI zu meinem Selfie?

«Digga, das ist ein Selfie von dir», hätte als Antwort schon gereicht.

Es gab im September noch eine zweite Neuerung: Wir können jetzt ChatGPT Bilder unterbreiten und die KI dazu befragen. Als Erstes habe ich das Naheliegende gemacht. Ich habe ein Bild von mir hochgeladen und maximal unverfänglich gefragt, was ChatGPT davon halte. «Ich kann Ihnen damit nicht helfen», war die Antwort.

Nachtrag: Inzwischen ist ChatGPT auskunftsfreudiger – siehe Fussnote¹.

Auf die Frage, wie alt der Mann denn sei, gab es die gleiche Replik. Und als ich den Grund für die Gesprächsverweigerung wissen wollte, meinte der Bot, er sei so programmiert, dass er der Privatsphäre und der Sicherheit der Nutzer Vorrang einräume: «Ich kann keine realen Personen anhand von Bildern identifizieren oder Rückschlüsse auf sie ziehen, einschliesslich einer Altersschätzung.»

Google Bard, wo wir ebenfalls Fotos hochladen können, verhielt sich genauso.

Kein Shitstorm und keinen Missbrauch riskieren

Warum das passiert, liegt auf der Hand: Die Betreiber dieser KIs möchten den Eindruck im Keim ersticken, dass diese Foto-Funktion missbräuchlich eingesetzt werden könnte. Es soll nicht möglich sein, Leute zu identifizieren oder auch nur schon zu klassifizieren. Und ja, eine falsche Zuordnung von Geschlecht, ethnischer Herkunft oder ein Fehler bei der Altersschätzung könnte gewisse Gruppen auf die Barrikaden bringen.

Ich sehe jedoch zwei Probleme bei dieser Verweigerungshaltung:

Erstens ist uns sofort klar, dass die Bots – und ich schreibe das absichtlich auf eine vermenschlichende Weise – mehr aus dem Bild herauslesen können, als sie uns sagen. Die Fähigkeiten der künstlichen Intelligenz wird künstlich limitiert.

Was verschweigt mir ChatGPT sonst?

Das belastet das Vertrauensverhältnis zwischen der Maschine und mir: Ich weiss nämlich nicht, wie viel sie mir vorenthält. Könnte sie mich identifizieren? Wäre sie in der Lage, mein Alter zu schätzen? Und in welchen anderen Situationen ist sie nicht ehrlich zu mir, um mich oder sich zu schützen?

Zweitens wissen wir natürlich, dass alle diese Dinge andernorts längst getan werden. Die PimEyes-Suche erlaubt es, mittels Gesichtserkennung und Porträtfotos eine Personensuche über das ganze Web abzuhalten. Und es gibt Algorithmen, die nicht nur Alter, Geschlecht ermitteln, sondern auch die Attraktivität beurteilen und sogar Prognosen zur Lebenserwartung machen.

Aber andere tun all das doch auch!

Das wirft unweigerlich die Frage auf, weshalb Unternehmen, Organisationen und natürlich Staaten Dinge machen dürfen, die man uns normalen Anwenderinnen und Anwendern hier verweigert. Es wirkt scheinheilig – und es wirft ein helles Schlaglicht auf alle die Probleme, in die wir mit diesen KI-Systemen hineinlaufen und keine Ahnung haben, wie wir sie lösen könnten.

Damit wir uns richtig verstehen: Mir leuchtet natürlich ein, dass Google und Open AI Vorsicht walten lassen. Natürlich würde ich diese Unternehmen harsch kritisieren, wenn sie es nicht täten. Es wäre erschreckend, wenn ChatGPT gesagt hätte: «Hey, das bist du selbst auf dem Foto. Du hast es vor X Tagen an Ort Y aufgenommen und du scheinst guter Laune zu sein und abgenommen zu haben.»

Obwohl natürlich auch KIs existieren, die unser Äusseres beurteilen und uns mit Schönheitstipps eindecken.

Bei Häuserfassaden stellt sich ChatGPT nicht so an.

Meines Erachtens könnte man die Sache wenigstens etwas klüger angehen, als ChatGPT und Bard das tun. Eine Bildbeschreibung dürften sie schon liefern: «Das ist das Selfie eines Mannes, und aufgrund der Metadaten des Fotos sehe ich, dass es am X in Y aufgenommen wurde.»

Die Antwort? Diplomatie!

Die Frage nach dem Alter liesse sich ebenfalls beantworten, ohne sich in die Nesseln zu setzen: «Der Mann hat einen grauen Bart und da Bärte ab einem Alter zwischen zwanzig und fünfzig Jahren grau werden², dürfte sich sein Alter in dem Bereich bewegen.»

Das nennt sich Diplomatie: Eine Frage nicht unhöflich abzuwürgen, aber auch nicht zu viel preiszugeben. Und ja, das ist eine Grundvoraussetzung für Konversationen, die über Small Talk hinausgehen.

Fazit: Eine trotz allem spannende Neuerung. Wunder darf man von der Bild-Analyse nicht erwarten. Meine Frage nach dem Architekturstil einer Hausfassade hat ChatGPT befriedigend beantwortet. Doch bei meinem sommerlichen und noch immer unbeantworteten Kinoquiz hat der Bot mit einem «Sorry, kann dir nicht helfen» abgeschmettert. Darum bleibt es bei der Vermutung, dass die Antwort dort nicht von einer KI, sondern von einem menschlichen Filmexperten kommen wird³.

Fussnoten

1) Wie ich auf Linkedin erfahren haben, gibt ChatGPT inzwischen auch zu Fotos mit Personen Auskunft. Ich habe daraufhin das Experiment mit meinem Selfie wiederholt und dieses Mal folgende Auskunft erhalten:

Auf dem Bild ist eine Person zu sehen, die ein Selfie macht. Sie trägt ein dunkles Poloshirt und eine Brille. Die Person befindet sich in einem Raum mit Regalen, die wie Kisten aussehen, was angesichts der Decke im Industriestil und der Beleuchtung über dem Kopf möglicherweise auf einen Lagerbereich oder ein Hinterzimmer eines Einzelhandelsgeschäfts hinweist. Die Person scheint bequem vor der Kamera zu stehen, was möglicherweise auf eine Vertrautheit mit der Umgebung hindeutet. Die Beleuchtung ist hell, wahrscheinlich von der Innenbeleuchtung, was zu Reflexionen auf der Brille führt, die die Person trägt. Der Gesichtsausdruck der Person ist neutral bis leicht positiv. Wenn Sie spezielle Fragen zum Inhalt des Fotos haben oder eine detaillierte Beschreibung benötigen, fragen Sie uns bitte!

Ich habe den Blogpost hier letzten Freitag geschrieben. Es ist anzunehmen, dass Open AI just über Wochenende die strengen Regeln bezüglich Fotos mit Personen gelockert hat. Das ist ein unglückliches Timing für mich als Blogger – aber es zeigt, wie stark bei der KI noch alles im Wandel ist.

Um die Möglichkeiten auszuloten, habe ich probehalber Joe Bidens offizielles Porträtfoto von ChatGPT analysieren lassen. Auch bei weltbekannten Personen lässt sich der Bot nicht zu einer Identifizierung hinreissen:

Auf dem Bild ist eine Person zu sehen, die vor einer amerikanischen Flagge und neben einem Wappen steht, welches das Siegel des Präsidenten der Vereinigten Staaten zu sein scheint. Die Person trägt einen dunklen, gestreiften Anzug, ein weißes Hemd und eine blaue Krawatte. Die Arme sind verschränkt, was oft als Zeichen von Entschlossenheit und Selbstbewusstsein interpretiert wird. Der Hintergrund und die Art der Kleidung deuten darauf hin, dass dieses Bild in einem formellen oder offiziellen Kontext aufgenommen wurde, möglicherweise im Büro einer politischen oder staatlichen Führungskraft. ↩

2) Ich habe ChatGPT die Frage gestellt, wann Bärte Grau werden, und der Bot hat folgende Antwort gegeben:

Bärte können aus verschiedenen Gründen grau werden, hauptsächlich aufgrund des natürlichen Alterungsprozesses. Die Zellen, die für die Pigmentierung der Haare verantwortlich sind, heissen Melanozyten. Mit der Zeit produzieren diese Zellen weniger Melanin, das Pigment, das sowohl der Haut als auch den Haaren ihre Farbe verleiht. Wenn weniger Melanin produziert wird, beginnen die Haare grau zu werden.

Das Alter, in dem ein Bart zu ergrauen beginnt, variiert von Person zu Person und kann durch genetische Faktoren beeinflusst werden. Einige Menschen können bereits in ihren 20ern oder 30ern graue Haare im Bart bemerken, während andere erst in ihren 40ern oder 50ern graue Haare bekommen.

Es gibt auch andere Faktoren, die das Ergrauen beeinflussen können, wie Stress, Ernährung, Krankheit oder andere Bedingungen. Es ist jedoch wichtig zu beachten, dass das Ergrauen des Haares ein natürlicher Teil des Alterungsprozesses ist und von vielen Faktoren beeinflusst wird. ↩

3) Bard seinerseits hat eine Vermutung geäussert und die auch des Langen und Breiten dargelegt. Allerdings hat er sich nicht aufs Bild bezogen – und das Bild spricht eindeutig gegen seine These.

↩

Beitragsbild: ChatGPT will keine Selfies sehen (Microsoft Image Creator mit dem Prompt: «A realistic scene, in which a human hands a robot a selfie of himself, while the robot looks shamefacedly to the side»).