Elon Musks neues KI-Modell, Grok 3, in einem harten Test: Die Recherche- und Reflexionsfähigkeiten sind grossartig. Doch bei der Neutralität gibt es Fragezeichen – und die Gelegenheit für Deepseek, den xAI-Chef in die Pfanne zu hauen.
Schlagwort: LLMs

Bei Chatbot Arena hetzen wir 86 Sprachmodelle aufeinander los. Es gibt eine globale Rangliste und interessante Einblicke darüber, welche KIs auf dem Aufstieg sind.

Schon wieder ein neues Sprachmodell auf der globalen KI-Bühne: Le Chat von Mistral. Eine erste Evaluation zeigt, dass dieses LLM aus Frankreich selbst ChatGPT, Perplexity und Claude das Wasser reichen kann.

Es klingt wie eine dumme Idee, ist für gewisse Lebenslagen jedoch nicht verkehrt: Ein grosses Sprachmodell auf dem Smartphone zu betreiben. Zwei iPhone-Apps für diesen Zweck: Private LLM und Local Chat im Test.

Prorata.ai ist ein Start-up, das Fairness und Transparenz ins Geschäft mit der künstlichen Intelligenz bringen will. Die Urheber von Inhalten, mit denen Sprachmodelle trainiert werden, sollen angemessen entlohnt werden.

Ist Deepseek tatsächlich so voreingenommen, wie alle behaupten? Oder hat jedes Sprachmodell so seine Vorurteile? Ich mache die Probe aufs Exempel und den Kopf hinhalten muss die reichste Ente der Welt.

Google AI Studio ist einen Klick wert: Es gibt Einblicke, wie wir zukünftig mit KI arbeiten werden und wir erhalten Tipps für unsere Prompts. Aber auch hier leistet sich Gemini unverzeihliche Ausrutscher.

Mit Openrouter.ai lassen wir mehrere grosse Sprachmodelle gegeneinander antreten. Sie beantworten parallel den gleichen Prompt. Im direkten Vergleich wird sofort klar, wer die der Herausforderung gewachsen ist und wer wie wild halluziniert.

Der Chef der massgeblichen KI-Community Hugging Face sagt, worauf wir uns bei der künstlichen Intelligenz im neuen Jahr einstellen müssen.

Wie gehen im Netz viral? Klar: Indem wir ein lustiges Meme von Reddit klauen – oder uns mithilfe von memecam.io selbst eines basteln.

Die Dot-App sei die «erste persönliche KI, die uns wirklich versteht», behauptet deren Erfinder. Ich habe versucht, mich ihr zu öffnen – und bin gescheitert. Eine aufschlussreiche Erfahrung war es trotzdem.

Ein knallharter Test von Googles neuer KI-App: Sie scheitert – genau wie ChatGPT und Copilot von Microsoft – am Vampirfledermaustest. Trotzdem kann ich Gemini fürs Smartphone auch positive Seiten abgewinnen.