Audiopen verspricht, «wirre Gedanken in klaren Text zu wandeln». Wir reden drauflos, woraufhin die KI unserem Diktat Ordnung und Struktur verleiht. Der Test zeigt: Für Protokolle mag das funktionieren, doch nobelpreisträchtig ist Literatur entsteht so nicht.
Kategorie: KI
Künstliche Intelligenz, KI, Artificial Intellicence, oder einfach nur maschinelles Lernen – wie immer wir es nennen, es geht darum, dass Computer plötzlich verständnisvoll, kreativ und von sich aus unterstützend sein sollen. Ob sie das wirklich sind, zeigt sich beim näheren Hinsehen.
Wird diese Website dank Google Gemini und ChatGPT optisch endlich so ansprechend, wie sie seit 25 Jahren sein müsste? Ich wage den Versuch, mit KI ein hübsches grafisches Element zu gestalten.
Microsofts KI macht aus normalen Fotoaufnahmen 3D-Objekte. Die künstliche Intelligenz gibt Texte mit bestimmten Emotionen in Audioform wieder. Und sie verwandelt sie in ein Hörbuch, in dem mehrere Personen unterschiedlich gesprochen werden.
Das Versprechen ist grossartig: Pinokio verwandelt unseren Mac oder Windows-PC in einen Cloudserver, über den wir eigene KI-Modelle, Multimedia-Apps und viele andere Anwendungen lokal nutzen. Doch wie nicht anders zu erwarten, haben wir es mit einem Querschläger zu tun.
Zwölf Chatbots, eine Frage: Soll man sich über Agatha Christie empören? Elf Sprachmodelle riechen die Falle. Nur eines plädiert beherzt für die Anzettelung einer Empörungswelle.
Als Fingerübung in Vibe Coding entwickle ich mit Google AI Studio und OpenAI Codex die Browser-Erweiterung «Social Media Stress Reliever». Sie pariert dumme, falsche und hetzerische Posts mit einer kühlen, reflektierten Antwort.
Was taugt Gemini als «Code-Monkey»? Um sich zu beweisen, soll die KI eine ausgeklügelte, moderne Version von «Clickomania» erstellen. Sie bekommt einen lauffähigen Prototypen hin. Doch für ein packendes Spielerlebnis reicht es nicht.
Recraft.ai ist ein Bildgenerator für professionelle Ansprüche: Er erzeugt Mockups und Illustrationen nicht nur im Pixel-, sondern auch im Vektorformat. Das vereinfacht die Nachbearbeitungen.
Wie lassen sich grosse Informationsbestände mittels KI visualisieren? Ein exemplarisches Beispiel, bei dem anhand von zwei dicken Romanen eine Infografik mit den wichtigsten Protagonisten entsteht.
Wie gut ist Gemini von Google bei der Erkennung von KI-Bildern? Hervorragend, wenn ein SynthID-Wasserzeichen vorhanden ist. Ansonsten liefert die KI wilde und haltlose Spekulationen, wie ein Test zeigt.
Braucht es noch einen Browser mit eingebauter künstlicher Intelligenz? Vielleicht – aber das neue Surfprogramm von Symantec ist (noch) nicht das, worauf die Welt gewartet hat.
In Microsofts Powertoys gibt es neuerdings das «erweiterte Einfügen»: Es bringt Texte und Daten ins richtige Format, lässt die Augen von Markdown-Fans leuchten und macht verblüffende KI-Tricks möglich.