Die neuen Sprachfunktionen von ChatGPT lassen noch auf sich warten. Im Mai sind sie als Teil von GPT-4o vorgestellt worden und haben viel Medienecho ausgelöst. Zu Recht, denn wenn wir mit der KI unbeschwert plaudern können, statt unsere Konversation mit Tippen und Warten abzuhalten, wäre das ein eindrücklicher und auch etwas beängstigender Fortschritt.
Doch wie lange es bei OpenAI noch dauern wird: Die Konversations-KI ist Realität. Ein weiterer Vertreter dieser Gattung ist Moshi: Das ist ein experimenteller Bot, «der gleichzeitig denken und reden kann», wie es in der Beschreibung heisst – weswegen uns die böse Bemerkung auf der Zunge liegt, dass er damit gewissen Mitmenschen etwas voraus hat.
Moshi soll auch gleichzeitig zuhören und reden können. Das wiederum wäre eine Voraussetzung für eine flüssige, natürliche Konversation, bei der man sich unterbrechen und ins Wort fallen kann. Bisher fühlen sich Unterhaltungen mit KIs eher wie ein Austausch von Funksprüchen an, bei dem wir aufs «Over» warten müssen, bevor wir uns zu Wort melden können.
Noch nicht ganz lebensecht
Das Urteil muss mit Kritik beginnen: Total lebensecht fühlt sich die Konversation mit Moshi nicht an. So reaktionsschnell wie ein durchschnittlicher Mensch ist die KI nicht. Die Unterhaltung wirkt wie eine Online-Telefonverbindung mit so beträchtlicher Latenz, dass man sich öfter unabsichtlich ins Wort fällt.
Dem eigenen Anspruch einer Unterhaltung mit «maximalem Flow zwischen dir und Moshi» wird diese Software nicht gerecht. Doch wenn wir die Messlatte bei den bisherigen Sprachassistenten anlegen, dann stellt Moshi einen gewaltigen Sprung dar – Siri und ihre Artgenossinnen sehen im Vergleich wirklich alt aus.
Damit sind wir bei der eigentlich interessanten Frage angelangt: Worüber sprechen wir mit einer solchen KI?
Die KI hat kein Leben, von dem sie erzählen könnte
Ein klassischer Chatbot erfüllt Aufträge, liefert Informationen und erledigt Arbeit. Für diese Dinge ist die Textform in den allermeisten Fällen besser geeignet. Gespräche hingegen erfüllen einen sozialen Zweck, sie sind unterhaltsam und erweitern den Horizont. Denken wir an den Smalltalk an Partys, mit Kollegen oder zwischen Tür und Angel. Wikipedia beschreibt ihn als Alltagsgespräch. Nur hat die KI eben keinen Alltag. Sie erlebt nichts, von dem sie erzählen könnte. Und sie hat keine Vorlieben oder Erfahrungen, an die es sich anknüpfen liesse.
Schon klar: Alle diese Dinge lassen sich simulieren. Die KI als Freundin, Partner und Begleiterin ist so real, dass mir schon vor drei Jahren einen Beziehungsratgeber für Menschen, die etwas mit einer KI haben habe einfallen lassen. Dieser Bereich hat seine Berechtigung, muss aber gesondert betrachtet werden. Ich glaube nicht, dass Apple bei Siri 2.0 in diese Richtung würde gehen wollen, weil sich da allerhand heikle Fragen stellen, von denen das Sexgeflüster nur eine ist.
«Talk sexy to me!»
Nehmen wir an, dass eine solche Smalltalk-KI in einem smarten Lautsprecher wie dem Homepod, Google Nest oder einem Amazon Echo laufen würde und wir mit ihr keine erotischen Fantasien würden ausleben wollen: Würde die von einer eigenen Persönlichkeit profitieren?
Natürlich werden es sich die Konzerne nicht nehmen lassen, diese Gefilde auszuloten: Wir werden Chuck Norris anweisen können, uns die Eieruhr zu stellen. Scarlett Johansson wird für uns die Notizen erfassen und Nichelle Nichols uns ansagen, um welche Uhrzeit der Zahnarzttermin ansteht. Vielleicht wird das sogar amüsant sein.
Wollen wir das? Uns nicht nur durch künstliche Intelligenz zu umgeben, sondern uns auch auf künstliche Kontaktpflege einzulassen? Ich würde das AS nennen, für artificial socializing. Besser als Einsamkeit ist es allemal. Aber was mich angeht, fühle ich mich nicht bereit und willens dafür.
Beitragsbild: Bald völlig normal? (Dall-e 3)