So langsam wird es unübersichtlich bei der KI. Es vergeht kaum ein Tag, dass ein neuer Akteur um die Ecke kommt und sein Modell präsentiert. Auch die altgedienten Anbieter lassen sich nicht lumpen und lancieren Updates und Features, dass es eine Freude ist. Beziehungsweise ein Riesenstress. Zumindest für Leute wie mich, deren Ehrgeiz darin besteht, bei dieser Entwicklung hinterherzukommen und sie als Blogger ausreichend zu würdigen.
Und die Leute, die sich nicht so intensiv mit der Materie befassen wollen, denen dürfte inzwischen schwindelig werden. Darum mache ich es mir heute zur Aufgabe, einen Überblick zu bieten: Welche KIs sollte man kennen? Welches Modell eignet sich wofür? Meine Einschätzung hier erfolgt subjektiv, nach meinen Gewohnheiten: Weil die sich meistens bewähren. Wenn es konkreter wird und ihr eine KI für eine spezifische Aufgabe benötigt, empfehle ich diese Methode hier.
1) Simple und schnelle Auskünfte
Für die ganz banalen Dinge verwende ich weiterhin eine normale Suchmaschine, meistens Google, und keine künstliche Intelligenz.
Erstens benötigt eine Websuche weniger Ressourcen. Zweitens ist es wichtig, sich aller KI zum Trotz weiterhin im freien Web zu bewegen und zu informieren. Falls mir Google keine guten Treffer liefert, weiche ich auf ChatGPT aus.
2) Vertiefte Recherchen

Zu den komplizierteren Recherchen zähle ich Anfragen, die sich schlecht in ein paar Suchbegriffe packen lassen. Das ist dann der Fall, wenn ein bestimmter Kontext beachtet werden muss oder zeitliche Einschränkungen notwendig sind, um sinnvolle Ergebnisse zu erhalten. Hier ist Perplexity meine erste Anlaufstelle. Falls mich die Antwort nicht überzeugt, wage ich einen zweiten Versuch mit der Websuche von ChatGPT.
Wenn ich es ganz genau wissen will, führe ich bei Grok eine Nachforschung mit Deepsearch-Methode durch.
3) Den Überblick über aktuelle Ereignisse erlangen
Zu aktuellen Geschehnissen verschaffe ich mir bei den Medien meines Vertrauens einen Überblick. Perplexity kommt zum Zug, wenn ich konkrete Fragen habe, deren Antworten sich nicht aus den Newsbeiträgen ergeben. Natürlich prüfe ich jeweils die angegebenen Quellen, und wenn dann noch Punkte offen sind, setze ich ChatGPT ein.
4) Redigieren und umformulieren
Ich formuliere meine Texte gern selbst. Darum kommt es eigentlich nie vor, dass ich mir Mails, Briefe oder Social-Media-Postings von der KI verfassen lasse. Trotzdem gibt es Situationen, in denen ein Sprachmodell als Ghostwriter okay ist. Bislang fiel diese Rolle ChatGPT zu. Doch seit ich diese französische KI getestet habe, gebe ich für diese Aufgabe Le Chat von Mistral den Vorzug.
5) Übersetzungen
Für beide Übertragungsrichtungen – von der Fremdsprache nach Deutsch und von Deutsch in die Fremdsprache – gibt es bei mir nur eine KI des Vertrauens: Deepl. Meine Tipps zu diesem Sprachtalent finden sich übrigens hier.

6) Bilder und Illustrationen
Bei den Bildgeneratoren gibt es eine besonders üppige Auswahl. Und das ist auch gut so: Es kommt oft vor, dass die ersten Versuche fehlschlagen und trotz allen Modifikationen am Prompt nicht das Gewünschte Resultat entsteht. Dann hilft nur eines: Das Glück beim nächsten Kandidaten zu suchen.
Ich klappere die Generatoren normalerweise in folgender Reihenfolge ab:
- Wenn ich Zeit habe, verwende ich Stable Diffusion mit der Draw Things-App auf dem Macbook Pro M3. Eine Alternative für Leute ohne die passende Hardware ist Leonardo.ai (Da Vinci würde sich vermutlich im Grab umdrehen).
- Soll es schnell gehen, kommt Adobe Firefly zum Zug (Was Adobe Firefly inzwischen kann – und was nicht).
- Der nächste Versuch erfolgt mit Grok. Falls auf dem Bild eine bekannte Persönlichkeit abgebildet sein soll, ist Grok der einzige Kandidat. Denn nur die KI von Elon Musk erlaubt die Erstellung von Motiven mit Promis.
- Wenn ich noch immer nicht am Ziel angelangt bin, teste ich den Prompt mit Bing (Die Software hat träumen gelernt), Dall-e, Imagine with Meta AI (Die Bilder-KI von Meta im Test) und Imagen 3 von Google (Googles Bilder-KI produziert grosse Momente – wenn sie keinen Aussetzer hat).
- Um anhand eines einzelnen Fotos ein KI-Bild einer Person oder eines Gegenstands zu produzieren, bietet sich Image Playground von Apple an (Auf Apples Bilder-Spielplatz blüht der Kitsch).
Tipps für fotorealistische Bilder liefere ich übrigens hier und hier.

7) Projekte mit Dateien und Dokumenten
Inzwischen sind die meisten Sprachmodelle in der Lage, einzelne Dateien zu analysieren. Doch wenn die Arbeit mit Dateien andauert und im Rahmen eines grösseren Projekts erfolgt, dann habe ich zwei klare Favoriten:
- ChatGPT mit der Projektfunktion (Vier Lieblings-Tipps für ChatGPT) oder alternativ mit einem eigenen GPT (So wird ChatGPT zum persönlichen Daten-Mineur)
- Google Notebook LM (Ein leistungsfähiges Recherche-Hilfsmittel)
8) Transkription längerer Audioaufnahmen
Um Audioaufnahmen zu verschriftlichen, setze ich meistens auf Happy Scribe (Eine Spracherkennung, die auch mit Dialekten klarkommt): Der Grund ist der praktische Editor für die Nachbearbeitung. Wenn es darauf nicht ankommt, dann verwende ich Macwhisper zur Transkription auf dem Mac. Wer keinen passenden Mac hat, kann Auphonic für diesen Zweck nutzen (Die KI, die auch Züritüsch versteht).
Auch hier gilt: Welches die beste Lösung ist, hängt von den Umständen ab. Der grosse Vergleich der Spracherkennungs-Tools erklärt die Stärken und Schwächen der einzelnen Produkte.
9) Texte einsprechen lassen
Die Sprachsynthese ist kein Gebiet, dass ich tagtäglich beackern würde. Dennoch: Wenn ich einmal keine Lust habe, einen Text selbst einzusprechen oder ihn nicht mit meiner eigenen, sondern einer fremden Stimme benötige, dann ist die Software von Elevenlabs meine erste Wahl (Als Frau klinge ich ganz schön sexy).

Als Tipp am Rand verweise ich gern auf den Newsreader von Elevenlabs, der uns Artikel in einer nicht nervenden Stimme vorliest.
10) Programmcode
Um Programmcode zu erzeugen, habe ich die besten Erfahrungen mit Claude gemacht (siehe hier und hier).

11) Text-zu-Video-Generatoren
Ich bin gespannt auf Veo 2 von Google. Doch da ich diese Software bislang nur vom Hörensagen kenne, führt kein Weg an Sora von OpenAI vorbei (Der Videogenerator Sora von OpenAI im Test).

Da Sora hierzulande nicht offiziell verfügbar ist, sei auf Canva und ähnliche Apps sowie auf Runwayml verwiesen: Sie fabrizieren eher Cinemagramme denn Videosequenzen, was aber für eine Präsentation o.ä. auch ausreicht.
12) Virtuelle Avatare auf die Menschheit loslassen
Das ist kein Anwendungsfall für die meisten von uns. Auch ich habe dieses Gebiet bloss aus Neugierde und nicht aus einer echten Notwendigkeit heraus erkundet. Dennoch der Hinweis, mit welchen Tools wir uns selbst oder fremde Personen als Avatare in Szene setzen können.
- Hourone.ai ist jene Software, die theoretisch das beste Ergebnis bieten sollte. Mein erster Auftritt als digitaler Mensch ist allerdings gescheitert.
- Geklappt haben meine Versuche aber mit D-ID.com (Diese KI glaubt, moderieren zu können).
Beitragsbild: An welcher Ecke steckt nochmal die KI für die neue Wohnungseinrichtung? – Spoiler: hier (Ben Mathis Seibel, Unsplash-Lizenz).