Ein rot-weisser Militärhelikopter fliegt am Himmel. Eine Person hängt an einem Seil, das zur Rettungsoperation genutzt wird. Wolken im Hintergrund.
Ein Content Creator wird vom wirtschaftlichen Untergang gerettet – Symbolbild (Inge Wallumrød, Pexels-Lizenz).

Ein Internet-Kollektiv will das freie Internet vor den KI-Konzernen retten

Das RSL Col­lec­tive hat ein heh­res Ziel: Mit einer auto­ma­ti­schen Li­zen­zie­rung soll je­der, des­sen Web­in­hal­te ge­ne­ra­ti­ve KI-Mo­del­le be­feuern, nach seinen Wün­schen ent­schä­digt werden.

Andreas Von Gunten ist umtriebiger Verleger und Digitalunternehmer, dem ich anfangs Jahr am Vin­tage Com­pu­ter Festival begegnete und der auch schon bei uns im Nerdfunk war. Neulich fragte er auf Linkedin:

Wie können Medien- und Kreativschaffende steuern, ob und wie Werke im Zusammenhang mit generativer KI genutzt werden und sie allenfalls sogar noch Geld dafür bekommen?

Eine berechtigte Frage: Denn die KI wird dazu führen, dass die Medien und unabhängige Webpublizisten massiv an Reichweite verlieren, während die Konzerne Geld mit den Sprachmodellen verdienen, die sie mit den Online-Inhalten von uns allen trainiert haben.

Konzepte, wie sich der Zusammenbruch des «Geschäftsmodells World Wide Web» verhindern liesse, gibt es: Pro Rata erprobt ein Verteilsystem, bei dem die Urheber der Inhalte am Umsatz partizipieren. Der KI-Bot Gist.ai führt vor, wie bei einer Antwort die Beiträge der einzelnen Informationslieferanten gewichtet werden und welche fundamentalen Probleme sich stellen, wenn diese Attribution fair erfolgen soll.

Doch selbst wenn die Methode funktionieren sollte, stellt sich ein nächstes Problem: Woher wissen die KI-Konzerne, welche Informationen sie wie verwerten können? Pro Rata arbeitet mit ein paar handverlesenen Partnern zusammen. Ich habe mich mit diesem Blog hier vor Monaten angemeldet, aber nie eine Rückmeldung bekommen.

Die ganze Welt muss partizipieren können

Dass dieser selektive Ansatz für eine nachhaltige Lösung nichts taugt, liegt auf der Hand: Denn wenn die globalen Informationsbestände via KI so breit erschlossen werden sollen wie heute via Google, dann muss der Zugang für die Inhaltsanbieter genauso niederschwellig sein wie bei einer Suchmaschine. Das heisst: Papierkram, Lizenzdeals oder andere Bürokratiehindernisse kommen nicht infrage. Die Crawler der Suchmaschinen finden unsere Websites von allein. Alles, was wir tun müssen, ist via robots.txt festzulegen, welche Inhalte sie sich einverleiben dürfen und welche nicht. Genauso simpel muss die Beteiligung bei der künstlichen Intelligenz möglich sein.

Von Gunten verweist für diesen Zweck auf RSL; das Really Simple Licensing:

RSL ist ein offener Standard, mit dem Verlage maschinenlesbare Lizenzbedingungen für ihre Inhalte definieren können, darunter Namensnennung, Bezahlung pro Crawl und Bezahlung pro Inferenz.

Der Standard ist brandneu: Er wurde am 10. September 2025 begründet, verrät Wikipedia. Er wird von RSL Collective getragen, einer gemeinnützigen Organisation, hinter der u. a. Eckart Walther steht. Dieser Mann arbeitete Ende der 1990er-Jahre für Netscape und wirkte an RSS mit: den Webfeeds, mit denen wir noch heute unsere Informationsquellen organisieren und Podcasts abonnieren.

In der Ansicht mit der «Top-Stories» erscheinen die Themen, zu denen mindestens fünf Beiträge veröffentlicht worden sind.
Ohne RSS wäre das Internet ärmer dran.

Das gibt dieser Idee Gewicht: Denn diese Technologie hat viel zum offenen Informationsfluss im Web beigetragen und ist auch heute noch eine Bastion gegen die «Plattformisierung». Dank RSS können unabhängige Podcast-Produzentinnen und -Produzenten ihre Produktionen distribuieren, ohne sich komplett von Spotify oder anderen Streaminganbietern abhängig machen zu müssen.

Zum RSL Collective zählt Doug Leeds als weiteres Internet-Urgestein, der Chef von Ask.com war. Und Reddit, Yahoo und Medium stehen hinter der Initiative.

Lizenzdeals werden vollautomatisch geschlossen

Technisch funktioniert RSL simpel: Die Lizenzbestimmungen werden in der Robots.txt-Datei hinterlegt und geben an, wie ein Unternehmen eine Lizenz erwirbt und unter welchen Bedingungen es sie nutzen darf – wie oben angedeutet, indem es die ursprüngliche Quelle angeben muss (Creative Commons), ein Abonnement nötig ist, pro Crawler-Zugriff eine Entschädigung fällig wird oder wie bei Pro Rata die Verwertung einer Information in einer KI-generierten Antwort kostenpflichtig wird.

Bleibt die Frage: Was halten wir davon?

Ich finde den Ansatz einleuchtend – und zwar nicht nur in Bezug auf die KI. Stellen wir uns vor, es hätte ihn vor zwanzig Jahren gegeben, als viele von uns mit dem Bloggen anfingen. Es ist nicht undenkbar, dass sich neue Formen der Monetarisierung ergeben hätten: durch Lese-Apps, Aggregatoren, Syndizierung, Republishing oder Repackaging (oder einem sonst noch für Schlagwörter auf der Zunge liegen). Und die, die sich noch an Flattr erinnern, malen sich womöglich eine Mikropayment-Lösung aus, bei der zahlungswillige Internetnutzerinnen und -Nutzer den Anbietern vollautomatisch eine Lizenz lösen: sprich, einen Obolus für den Informationskonsum entrichten.

Damit sind wir beim Problem: Solche offenen Lösungen funktionieren prächtig, wenn alle Teilnehmer nach den Spielregeln spielen. Wenn wir aber eines aus den letzten zwanzig Jahren gelernt haben, dann ist es die bittere Lektion, dass das nicht der Fall ist: Die Tech-Giganten können gar nicht anders, als die Regeln während der laufenden Partie zu ihren Gunsten zu ändern.

Fairplay ohne Schiedsrichter?

Werden sich OpenAI, Google, Microsoft, Apple, Meta, Anthropic, Mistral und Konsorten an diese Abmachungen halten? Für die Antwort sollten wir uns daran erinnern, dass sie sich bis jetzt nicht die Mühe gemacht haben, um überhaupt nach einer Erlaubnis zum Training ihrer KIs mit unseren Daten zu fragen. Warum sollten sie es jetzt tun, nachdem ihre Produkte für viele von uns bereits unverzichtbar sind? Und selbst wenn sie sich des lieben Friedens willen darauf einlassen: Wie können wir jemals sicher sein, dass sie zahlen, was sie müssten?

Gist versucht, den Anteil der einzelnen Quellen an der Antwort der KI auszuweisen.

Stellen wir uns vor, dass ich (via Word­press-Plug-in) meine Inhalte für die KI zur Verfügung stelle, aber für die Verwendung pro KI-generierter Antwort bezahlt werden will: Angesichts der oben erwähnten Probleme bei der Attribution ist es ein Klacks, meinen Anteil kleinzurechnen oder zum Verschwinden zu bringen. Denn es glaubt wohl niemand daran, dass es effektive Kontrollmechanismen geben wird. Um bei der Sportmetapher zu bleiben: Wer glaubt, dass ohne Schiedsrichter fair gespielt wird? Doch sollte der Internet-Schiri plötzlich kommen?

Das Tal der Tränen bleibt uns nicht erspart

Fazit: Ich begrüsse RSL und werde es bei Gelegenheit hier im Blog implementieren. Allzu viel erhoffe ich mir nicht. Ich rechne damit, dass ein langes, tiefes Tal der Tränen vor uns liegt und sich eine Lösung erst ergeben wird, wenn die KI-Konzerne das Web so leergesaugt haben, dass ihnen der Nachschub an Trainingsmaterial für ihre Modelle ausgeht. Und falls jemand den Einwand machen sollte, dass kein Unternehmen so verrückt sein kann, sich seine eigene Lebensgrundlage zu entziehen, dann – tja, dann wäre es wohl an der Zeit, auf die fossile Energiewirtschaft, die Fischereiindustrie, die Holzwirtschaft, die Intensivlandwirtschaft oder die Grossbanken zu verweisen …

Kommentar verfassen