Welches ist die beste KI? Tipps für zwölf Einsatzgebiete

Das Angebot KI-Lö­sungen wird immer grös­ser und un­über­sicht­li­cher. Beim Durch­blick hilft diese Gesamt­schau, die für Recher­che, Texten, Über­setzen, Pro­jekt­ver­wal­tung und Daten­ana­lyse, Bild-, Ton- und Vi­deo­er­zeu­gung die be­währ­ten Pro­duk­te nennt.

So langsam wird es unübersichtlich bei der KI. Es vergeht kaum ein Tag, dass ein neuer Akteur um die Ecke kommt und sein Modell präsentiert. Auch die altgedienten Anbieter lassen sich nicht lumpen und lancieren Updates und Features, dass es eine Freude ist. Beziehungsweise ein Riesenstress. Zumindest für Leute wie mich, deren Ehrgeiz darin besteht, bei dieser Entwicklung hinterherzukommen und sie als Blogger ausreichend zu würdigen.

Und die Leute, die sich nicht so intensiv mit der Materie befassen wollen, denen dürfte inzwischen schwindelig werden. Darum mache ich es mir heute zur Aufgabe, einen Überblick zu bieten: Welche KIs sollte man kennen? Welches Modell eignet sich wofür? Meine Einschätzung hier erfolgt subjektiv, nach meinen Gewohnheiten: Weil die sich meistens bewähren. Wenn es konkreter wird und ihr eine KI für eine spezifische Aufgabe benötigt, empfehle ich diese Methode hier.

1) Simple und schnelle Auskünfte

Für die ganz banalen Dinge verwende ich weiterhin eine normale Suchmaschine, meistens Google, und keine künstliche Intelligenz.

Erstens benötigt eine Websuche weniger Ressourcen. Zweitens ist es wichtig, sich aller KI zum Trotz weiterhin im freien Web zu bewegen und zu informieren. Falls mir Google keine guten Treffer liefert, weiche ich auf ChatGPT aus.

2) Vertiefte Recherchen

Perplexity ist der Aktualität (meistens) gewachsen.

Zu den komplizierteren Recherchen zähle ich Anfragen, die sich schlecht in ein paar Suchbegriffe packen lassen. Das ist dann der Fall, wenn ein bestimmter Kontext beachtet werden muss oder zeitliche Einschränkungen notwendig sind, um sinnvolle Ergebnisse zu erhalten. Hier ist Perplexity meine erste Anlaufstelle. Falls mich die Antwort nicht überzeugt, wage ich einen zweiten Versuch mit der Websuche von ChatGPT.

Wenn ich es ganz genau wissen will, führe ich bei Grok eine Nachforschung mit Deepsearch-Methode durch.

3) Den Überblick über aktuelle Ereignisse erlangen

Zu aktuellen Geschehnissen verschaffe ich mir bei den Medien meines Vertrauens einen Überblick. Perplexity kommt zum Zug, wenn ich konkrete Fragen habe, deren Antworten sich nicht aus den Newsbeiträgen ergeben. Natürlich prüfe ich jeweils die angegebenen Quellen, und wenn dann noch Punkte offen sind, setze ich ChatGPT ein.

4) Redigieren und umformulieren

Ich formuliere meine Texte gern selbst. Darum kommt es eigentlich nie vor, dass ich mir Mails, Briefe oder Social-Media-Postings von der KI verfassen lasse. Trotzdem gibt es Situationen, in denen ein Sprachmodell als Ghostwriter okay ist. Bislang fiel diese Rolle ChatGPT zu. Doch seit ich diese französische KI getestet habe, gebe ich für diese Aufgabe Le Chat von Mistral den Vorzug.

5) Übersetzungen

Für beide Übertragungsrichtungen – von der Fremdsprache nach Deutsch und von Deutsch in die Fremdsprache – gibt es bei mir nur eine KI des Vertrauens: Deepl. Meine Tipps zu diesem Sprachtalent finden sich übrigens hier.

Deepl übersetzt auch Dokumente.

6) Bilder und Illustrationen

Bei den Bildgeneratoren gibt es eine besonders üppige Auswahl. Und das ist auch gut so: Es kommt oft vor, dass die ersten Versuche fehlschlagen und trotz allen Modifikationen am Prompt nicht das Gewünschte Resultat entsteht. Dann hilft nur eines: Das Glück beim nächsten Kandidaten zu suchen.

Ich klappere die Generatoren normalerweise in folgender Reihenfolge ab:

  1. Wenn ich Zeit habe, verwende ich Stable Diffusion mit der Draw Things-App auf dem Macbook Pro M3. Eine Alternative für Leute ohne die passende Hardware ist Leonardo.ai (Da Vinci würde sich vermutlich im Grab umdrehen).
  2. Soll es schnell gehen, kommt Adobe Firefly zum Zug (Was Adobe Firefly inzwischen kann – und was nicht).
  3. Der nächste Versuch erfolgt mit Grok. Falls auf dem Bild eine bekannte Persönlichkeit abgebildet sein soll, ist Grok der einzige Kandidat. Denn nur die KI von Elon Musk erlaubt die Erstellung von Motiven mit Promis.
  4. Wenn ich noch immer nicht am Ziel angelangt bin, teste ich den Prompt mit Bing (Die Software hat träumen gelernt), Dall-eImagine with Meta AI (Die Bilder-KI von Meta im Test) und Imagen 3 von Google (Googles Bilder-KI produziert grosse Momente – wenn sie keinen Aussetzer hat).
  5. Um anhand eines einzelnen Fotos ein KI-Bild einer Person oder eines Gegenstands zu produzieren, bietet sich Image Play­ground von Apple an (Auf Apples Bilder-Spielplatz blüht der Kitsch).

Tipps für fotorealistische Bilder liefere ich übrigens hier und hier.

Adobe Firefly liefert Bilder, die oft ziemlich echt aussehen.

7) Projekte mit Dateien und Dokumenten

Inzwischen sind die meisten Sprachmodelle in der Lage, einzelne Dateien zu analysieren. Doch wenn die Arbeit mit Dateien andauert und im Rahmen eines grösseren Projekts erfolgt, dann habe ich zwei klare Favoriten:

8) Transkription längerer Audioaufnahmen

Um Audioaufnahmen zu verschriftlichen, setze ich meistens auf Happy Scribe (Eine Spracherkennung, die auch mit Dialekten klarkommt): Der Grund ist der praktische Editor für die Nachbearbeitung. Wenn es darauf nicht ankommt, dann verwende ich Macwhisper zur Transkription auf dem Mac. Wer keinen passenden Mac hat, kann Auphonic für diesen Zweck nutzen (Die KI, die auch Züritüsch versteht).

Auch hier gilt: Welches die beste Lösung ist, hängt von den Umständen ab. Der grosse Vergleich der Spracherkennungs-Tools erklärt die Stärken und Schwächen der einzelnen Produkte.

9) Texte einsprechen lassen

Die Sprachsynthese ist kein Gebiet, dass ich tagtäglich beackern würde. Dennoch: Wenn ich einmal keine Lust habe, einen Text selbst einzusprechen oder ihn nicht mit meiner eigenen, sondern einer fremden Stimme benötige, dann ist die Software von Eleven­labs meine erste Wahl (Als Frau klinge ich ganz schön sexy).

Im Editor der Evenlabs-Software lassen sich dem virtuellen Sprecher Vorgaben zu seiner «Performance» machen.

Als Tipp am Rand verweise ich gern auf den Newsreader von Eleven­labs, der uns Artikel in einer nicht nervenden Stimme vorliest.

10) Programmcode

Um Programmcode zu erzeugen, habe ich die besten Erfahrungen mit Claude gemacht (siehe hier und hier).

So sieht es aus, wenn Claude auf eine kurze Frage gleich ein fixfertiges Game liefert.

11) Text-zu-Video-Generatoren

Ich bin gespannt auf Veo 2 von Google. Doch da ich diese Software bislang nur vom Hörensagen kenne, führt kein Weg an Sora von OpenAI vorbei (Der Videogenerator Sora von OpenAI im Test).

Sora ist ein Text-zu-Video-Generator.

Da Sora hierzulande nicht offiziell verfügbar ist, sei auf Canva und ähnliche Apps sowie auf Runwayml verwiesen: Sie fabrizieren eher Cinemagramme denn Videosequenzen, was aber für eine Präsentation o.ä. auch ausreicht.

12) Virtuelle Avatare auf die Menschheit loslassen

Das ist kein Anwendungsfall für die meisten von uns. Auch ich habe dieses Gebiet bloss aus Neugierde und nicht aus einer echten Notwendigkeit heraus erkundet. Dennoch der Hinweis, mit welchen Tools wir uns selbst oder fremde Personen als Avatare in Szene setzen können.

Beitragsbild: An welcher Ecke steckt nochmal die KI für die neue Wohnungseinrichtung? – Spoiler: hier (Ben Mathis Seibel, Unsplash-Lizenz).

Kommentar verfassen