Löcher im Web

Im Internet stapeln sich, bildlich gesprochen, die Leichen: Einerseits die toten Links, die unvermeidlich und trotzdem ärgerlich sind. Noch betrüblicher sind sind eingebettete Inhalte, die verloren gehen.

Tote Links sind eine mühsame Angelegenheit. Sie führen dazu, dass bei einem Klick nicht der gewünschte Webinhalt, sondern bloss eine Fehlermeldung erscheint. Denn entgegen der oft gehörten Behauptung, dass das Internet angeblich nichts vergisst, verschwinden ganz schön viele Inhalte.

Ich habe nach einer Statistik gesucht, die diesen Prozess veranschaulichen würde. Zum Beispiel: Wie viele Websites verschwinden jedes Jahr? Auch aufschlussreich wäre eine ungefähre Antwort auf die Frage, welcher Anteil des bei der Wayback Machine archivierten Inhalts unter der Originaladresse nicht mehr zu finden ist.

Was diese Website hier angeht, habe ich mit den hier beschriebenen Methoden herausgefunden, dass inzwischen mindestens auf jeder zehnten Seite ein toter Link zu finden ist. (Die kostenlose Variante des Dienstes überprüft maximal 3000 Seiten und hat darauf 319 tote Links entdeckt.) Dieser Anteil nimmt natürlich zu, je älter die Beiträge werden. Einige Stichproben bei den Beiträgen von 2007 zeigen, dass über den Daumen gepeilt die Hälfte der Links nicht mehr funktionieren.

Über die Gründe haben wir seinerzeit im Nerdfunk gesprochen, und sie sind vielfältig. Die Webseiten-Betreiber verlieren die Lust oder die Möglichkeit, ihre Website weiterhin zu betreiben. Alte Content-Management-Systeme geben den Geist auf und es ist mit vertretbarem Aufwand nicht möglich, die Inhalte auf eine neue Plattform zu übertragen. Und auch wenn die Migration klappt, ändern sich oft die Links. (Weil sich nicht alle Leute mit .htaccess auskennen.)

Fremde Inhalte einzubetten, birgt Risiken

Eine Variante des Problems sind absterbende eingebettete Inhalte. Das sind Dinge, die von fremden Servern geladen werden und als integraler Bestandteil der eigenen Website erscheinen. Solche «Leichen» sind besonders lästig, weil sie sofort ins Auge stechen und weil sie oft den Hauptinhalt eines Beitrags betreffen.

Ein Beispiel hat Andreas Von Gunten kürzlich im Beitrag Wenn Online-Angebote ihren Dienst einstellen, verlierst Du Deinen eingebetteten Content beschrieben. Ein anderes Beispiel ist meine alte Radiorubrik Verschwörungstheorie der Woche, die ich via Soundcloud hier im Blog eingebettet habe. Nun haben die Leute bei Soundcloud den alten Player offensichtlich abgeschaltet. Das sieht man etwa bei The White House Putsch. Anstelle des Wiedergabeknopfs erscheint bloss ein grosses weisses Nichts¹. Es ist für einen Besucher unmöglich, diese Podcastfolge anzuhören. Nur wenn er den Titel googeln würde, fände er eine Wiedergabemöglichkeit bei Soundcloud. Allerdings habe ich dem Blogpost oft einen anderen Titel als der Audiodatei gegeben.

Ein schwer kalkurlierbares Risiko

Das ist besonders ärgerlich, weil die Audiodatei bei Soundcloud nach wie vor vorhanden ist und mir Soundcloud auch nach wie vor die Jahresgebühr für mein Pro-Unlimited-Abo abknöpft. Betroffen sind die Beiträge, die ich bis zum August 2012 veröffentlicht habe. Bei den Beiträgen vor dem Januar 2012 erscheint ein Flash-Element, bei dem immerhin der Satz Please visit soundcloud.com to listen to this content steht. Man hätte sich bei Soundcloud allerdings die Mühe machen können, einen Link direkt zum richtigen Track einzufügen. Immerhin: Bei dieser Verlinkungsform hat Soundcloud einen normalen Link in den HTML-Code eingefügt, der zur richtigen Stelle führt.

Natürlich, schuld ist hier die technische Entwicklung. Die Webtechnologien wandeln sich und darum ist es vielleicht nicht möglich, einen alten Player für immer am Leben zu erhalten. Vielleicht hätte man sich bei Soundcloud einfach ein bisschen mehr Mühe geben müssen. Und man hätte beim Entwickeln der Einbettungsmethoden diesen Fall abdecken müssen. Wie wäre es zum Beispiel mit einer Methode, bei der die Originalquelle so hinterlegt ist, dass der Browser notfalls auf einen Standard-Player zurückfallen kann?

Jedenfalls stellt sich die Frage, ob ich mir die Mühe machen soll, die alten Beiträge neu zu verlinken. Theoretisch finde ich ja, praktisch fehlt mir die Zeit.

Bilder von Getty einzubetten, war keine gute Idee

Doch es ergeben sich ganz praktische Tipps für den Umgang mit einbettbaren Inhalten:

  • Wenn man auf Einbettungen verzichten kann, sollte man auch darauf verzichten. Ein gutes Beispiel ist die hier beschriebene Möglichkeit, Bilder von der Bildagentur Getty einzubetten. Ich habe das früher gemacht. Heute tue ich es nicht mehr. Erstens, weil das Angebot an Public-Domain-Fotos steigt. Zweitens, weil auch Getty-Bilder zurückgezogen werden. Eines der Beispielbilder in meiner Besprechung ist nicht mehr vorhanden. Stattdessen heisst es: «Dieses Bild steht nicht mehr zur Verfügung.»
  • Sinnvoll ist, ein Link zur Quelle anzugeben. Das tue ich bei meinen Patentrezept-Videos. Denn wie hier beschrieben, ist das Einbetten ein Gebastel. Und der Videoplayer wird auch immer mal wieder aktualisiert, sodass die alten Videos nicht mehr erscheinen. Auch bei diesen Beiträgen müsste ich den Code von Hand aktualisieren, was aber leider noch mehr Arbeit wäre als bei Soundcloud.
  • Wenn man die eingebetteten Inhalte selbst unter Kontrolle hat, dann hilft das. Ich werde irgendwann nicht darum herumkommen, die alten Patentrezept-Videos bei Youtube hochzuladen und so einzubetten. Apropos: Kennt jemand eine gute Methode für Batch-Uploads bei Youtube?
  • Man sollte sich die Quelle ansehen: Wie wahrscheinlich ist es, dass die in ein paar Jahren noch da ist? (Andererseits: Sowohl bei Getty als auch bei Soundcloud würde man die Wahrscheinlichkeit hoch ansetzen.)

Bei Youtube hängt es sehr davon ab, wer ein Video hochgeladen hat, ob es nach ein paar Tagen, Wochen oder Monaten noch da ist. Zu den verschwindenden Videos bei Youtube habe ich übrigens eine Statistik gefunden. Dazu mehr hier.

Fussnoten

1) Dieses Problem hat sich zum Glück recht einfach lösen lassen. Ein Tipp dazu bezieht sich auf die im Beitrag Perfektion hat ihren Preis vorgestellte WordPress-Erweiterung Search Regex.

Beitragsbild: Das Bild ist weg, aber immerhin ist die Ananas noch da (Pineapple Supply Co./Pexels, CC0).

Kommentar verfassen