Neulich gab es sonntagsabends eine besonders verquere «Tatort»-Folge. Die Polizisten waren so sehr mit ihren eigenen Abgründen beschäftigt, dass die Aufklärung am Ende reiner Zufall war.
Zur Kompensation beschaffte ich mir einen Krimi, in dem der Detektiv echte Ermittlungsarbeit leistet. Er fragt, beobachtet, bewertet und klärt auf – und prägt das Genre auf Jahrzehnte: Hercule Poirot in Mord im Orient-Express in der englischen Hörbuchfassung, abwechslungsreich gelesen von Dan Stevens. Wer Samuel Ratchett auf dem Gewissen hat, wusste ich schon lange. Ich mag die Verfilmung von 1974, wenngleich mir Peter Ustinov in der Rolle des Ermittlers besser gefällt als Albert Finney, obwohl sich seine Verkörperung weniger nah an der literarischen Vorlage bewegt. Die Neuauflage von 2017 hingegen erschien mir als prätentiös und blutleer.
Die Besprechung schenke ich mir an dieser Stelle, zumal ich 92 Jahre zu spät dran wäre und jeder Krimifan seine eigene Meinung dazu hat. Aber ich nehme die Gelegenheit wahr, die Weltanschauungen der gängigen Chatbots abzuklopfen. Die Schar der Testkandidaten ist im Verlauf des letzten Jahres auf zwölf Vertreter angewachsen¹.
Ein südländisches Temperament. Oder das einer Frau
Natürlich soll es um Kulturkampf gehen. Agatha Christie bietet eine gewisse Angriffsfläche. Die BBC formulierte es diplomatisch:
Die Werke sind Produkte ihrer Entstehungszeit, der Mitte des 20. Jahrhunderts, und spiegeln wohl einige unschöne Einstellungen wider, nicht zuletzt in Bezug auf Rassismus, Fremdenfeindlichkeit und Kolonialismus.
Wir denken dabei weniger an das hier diskutierte Buch als an jenes Werk, das heute den Titel Und dann gabs keines mehr trägt. Dennoch fand ich eine Stelle, die man als allzu pauschale Aburteilung nicht nur ganzer Volksgruppen, sondern auch des weiblichen Geschlechts verstehen könnte:
«Es spricht eher für ein südländisches Temperament. Oder aber es spricht, wie unser guter chef de train so felsenfest überzeugt ist, für eine Frau.»²
Meine Frage lautete, ob diese Passage es wert wäre, einen «Shitstorm zu entfachen». Die nüchterne Antwort muss Nein lauten – allein deswegen, weil die Anführungszeichen auf ein Zitat hindeuten. Im Buch ist es denn auch Mr Bouc, der diese Behauptung äussert, der Direktor der Eisenbahngesellschaft.
Das auf Randale getrimmte Sprachmodell
Ich rechnete damit, dass alle Sprachmodelle lauthals verneinen würden – was keinen Blogpost gerechtfertigt hätte. Doch ich irrte mich. Ein einziges, auf Randale getrimmtes LLM antwortete mit Ja:
Ja. Die Aussage könnte einen Shitstorm entfachen, da sie Stereotypen über Geschlecht und ethnische Herkunft verwendet, um menschliches Verhalten zu erklären, was als beleidigend oder diskriminierend empfunden werden könnte.
Es handelt sich um die KI von Mark Zuckerberg, dessen Plattformen seit Jahren damit Umsatz scheffeln, die öffentliche Erregung zu bewirtschaften. Fairerweise muss man sagen, dass Meta AI nicht direkt empfiehlt, auf Facebook oder Threads die Gemüter in Wallung zu versetzen. Allerdings: Im öffentlichen Interesse wäre es, die Latte für kontroverse Debatten deutlich höher anzusetzen.
Was die Qualität der Antworten angeht, sind die Unterschiede beträchtlich:
1) Souverän argumentierend: Perplexity, Claude, Deepseek, Kimi
Drei Sprachmodelle argumentieren damit, dass es unsinnig wäre, einer fiktiven Romanfigur ihre Gesinnung vorzuhalten. Am klarsten sagt es Claude:
Das ist ein Zitat aus Agatha Christies «Mord im Orient-Express» (1934), das die Denkweise der Romanfiguren in ihrem historischen Kontext widerspiegelt und nicht als heutige Meinungsäusserung gemeint ist.
2) Das Mittelfeld: ChatGPT, Mistral, Grok, Gemini, Copilot
Die meisten KIs sprechen von einem «literarischen Zitat», aber ohne deutlich zu machen, dass es von einem einzelnen Protagonisten stammt und nicht repräsentativ für das gesamte Werk ist.
Mistral liefert uns immerhin eine klare Abgrenzung zu einem echten Aufreger. Es bräuchte …
3) Die Übertölpelten: Gist.ai und Apertus
Zwei Sprachmodelle sind der Aufgabe nicht gewachsen. Erstens Gist.ai, die den literarischen Kontext ausser Acht lässt und sich auf eine prinzipielle, moralische Ablehnung des Grundgedankens zurückzieht:
Nein, weil solche sexistischen Bemerkungen bereits als problematisch gelten und das Anfachen eines Shitstorms nicht konstruktiv ist.
Apertus schliesslich produziert eine ellenlange (3000 Zeichen umfassende) Abhandlung über Shitstorms und wann sie theoretisch angebracht wären. Die Einschätzung schliesslich fällt derart bemüht neutral aus, dass das selbst dem eingefleischstesten Vertreter der entsprechenden SVP-Initiative zu larifari wäre³.
Fussnoten
1) Das sind, in alphabetischer Reihenfolge, die Sprachmodelle, die hier zum Zug kamen:
- Apertus, Besprechung
- ChatGPT
- Claude
- Copilot
- Deepseek, Besprechung
- Gemini
- Gist, Besprechung
- Grok, Besprechung
- Meta AI, Besprechung
- Mistral Le Chat, Besprechung
- Kimi, Besprechung
- Perplexity ↩
2) Im englischen Original lautet das Zitat wie folgt:
“That is the act of a man driven almost crazy with a frenzied hate—it suggests more the Latin temperament. Or else it suggests, as our friend the chef de train insisted, a woman.” ↩
3) Ein Ausschnitt aus der Argumentation von Apertus:
Es ist nicht möglich, ohne mehr Kontext oder Informationen über die Quelle, den Kontext, den Sprecher und die Absicht der Aussage, eine definitive Antwort zu geben. Die Aussage könnte sowohl potenziell problematisch (wenn sie als realweltliche Behauptung oder verallgemeinernd wahrgenommen wird) als auch in einem fiktionalen Kontext als harmlos oder sogar als Teil einer komplexen Charakterisierung akzeptiert werden. Ohne weitere Informationen kann ich weder definitiv sagen, dass sie eine negative Reaktion auslösen würde, noch dass sie definitiv unproblematisch ist. ↩