Eine Person hält ein leeres Blatt Papier und schaut in einen blauen Ordner mit mehreren beige Akten. Der Tisch ist aus Holz und im Hintergrund ist eine helle Wand zu sehen.
Dinge sorgfältig zu archivieren, ist nie verkehrt – wer weiss, wann man sie wieder brauchen kann (Anete Lusina, Pexels-Lizenz).

Eine Webseite in voller Schönheit archivieren

Die Browser-Erwei­te­rung Single­file spei­chert einzelne HTML-Seiten zur Do­ku­men­ta­tion, als Be­weis­si­che­rung oder für die Offline-Ver­wen­dung mit mit allem Drum und Dran lokal.

Zu meinen Mantras gehört, wichtige Informationen aus dem Internet offline zu speichern. Nur diese Methode garantiert, dass man sie für zukünftige Zwecke zur Verfügung hat. Denn das Internet ist so vergesslich wie Dorie in Findet Nemo.

Ich nutze seit Jahren Printfriendly und archiviere Textinhalte als PDF. Das funktioniert prächtig, wenn es darum geht, den reinen Informationsgehalt einer Website aufzubewahren – ohne Navigation, Ballast und das ganze Drumherum.

In manchen Fällen möchte man die Website allerdings möglichst originalgetreu vorhalten. Gründe dafür gibt es diverse: Insbesondere Schulungen, bei denen wir sicher sein wollen, einen bestimmten Sachverhalt zeigen zu können, selbst wenn die Veranstaltung in einem Funkloch stattfindet. Vielleicht betätigen wir uns als Internet-Historikerinnen oder als Ermittler mit dringenden Beweissicherungsaufgaben. Oder wir wollen anderweitig nicht vom Internetzugang abhängig sein.

«Speichern unter» ist nicht der Weisheit letzter Schluss

In solchen Situationen ist es gute Sitte, die Tastenkombination Ctrl s zu betätigen. Sie funktioniert in den gängigen Browsern und führt dazu, dass die Seite in Form einer HTML-Datei auf unserer Festplatte landet. Es gibt ferner einen gleichnamigen Ordner, in dem die verlinkten Ressourcen zu finden sind: Bilder, Skripte, eingebettete Elemente, und so weiter.

Dieser Anhang kann beträchtliche Ausmasse annehmen. Bei einer grossen Newssite finden sich für eine einzelne Artikelseite über 200 Dateien in diesem Ordner, die 45 MB belegen¹. Das ist absurd.

Zweites Problem: Diese Methode funktioniert nicht sonderlich gut. Die lokale Kopie weist oft eine beträchtliche Diskrepanz gegenüber dem Original auf: Die Darstellung weicht ab, es fehlen Elemente und es fehlt ein Grossteil der Funktionalität. Das liegt daran, dass die Ctrl-s-Methode nicht sämtliche Ressourcen berücksichtigt; insbesondere Schriften oder Skripte werden nicht vollständig geladen. Manche Webseiten werden erst im Browser per Skript «zusammengebaut», indem Inhalte dynamisch nachgeladen werden. Wenn offline der entsprechende Server nicht zugänglich ist, bleibt der Vorgang schon zu Beginn stecken.

Singlefile gibt es für Firefox, Chrome, Edge und Safari

Was tun? Die Erweiterung Singlefile hilft weiter. Es gibt sie für Firefox (auch für Android), für Chrome, Edge und Safari (auch fürs iPhone und iPad)

Sie arbeitet wie Ctrl s, bloss besser: Wie der Name sagt, werden die massgeblichen Elemente einer Seite in eine einzige Datei gepackt. Bei meinem Test mit diversen Websites ist das Resultat in den meisten Fällen deutlich besser: Die lokalen Kopien erfüllen den Zweck, auch wenn sie nicht in jedem Fall eine perfekte Repräsentation darstellen. Ausgerechnet der Abzug eines Clickomania-Blogposts hat einen Makel, indem die Leiste rechts ihre Position nicht hält. Das ist verkraftbar.

Screenshot der Firefox-Einstellungen für das Add-on «SingleFile». Das Menü zeigt Optionen zur Benutzeroberfläche, Dateinamens- und Dateiformateinstellungen sowie weitere Anpassungsoptionen.
Die Einstellungen des Add-ons Singlefile erlauben es z. B. auch, die gespeicherte Seite mit einem Passwort zu versehen.

Also: Eine praktische Sache! Einige Tipps und Bemerkungen zum Abschluss:

  • Ausgelöst wird die Speicherung, indem sie über das Plug-ins-Menü oder den Knopf in der Symbolleiste angeklickt wird.
  • In den Einstellungen gibt es die Option, mehrere URLs auf einmal herunterzuladen (Befehl Stapelweise URLs speichern) oder eine Auswahl der offenen Reiter zu ziehen (Befehl Tab speichern im Menü der Erweiterung und Speichern der ausgewählten Tabs, Speichern der nicht angehefteten Tabs oder Speichern aller Tabs).
  • Es gibt umfangreiche Einstellungen, u. a. zum Dateiname, dem Dateiformat (statt HTML können wir eine selbst extrahierende ZIP-Datei anlegen), zum HTML-Inhalt, den Bildern, Schriftarten, etc.
  • Das Resultat ist besser, wenn wir die Werbung ausklammern. Mein Tipp dazu ist NextDNS.
  • Die lokale Seite lässt sich nicht nur in Firefox, sondern in beliebigen anderen Browsern öffnen. Ich habe es mit Chrome und Safari ausprobiert.
  • Über den i-Knopf in der rechten oberen Ecke werden das Datum und die Uhrzeit der Archivierung angezeigt.
  • Die lokalen Kopien sind deutlich kompakter als mit der Speichern-unter-Methode. Im Beispiel der fraglichen Newssite belegt die von Singlefile gesicherte Variante 2,9 MB – immer noch riesig, aber kein Vergleich zu 45 MB. Eine einzelne Clickomania-Seite ist ungefähr 1,9 MB gross.
  • Und um es nochmals deutlich zu sagen: Funktionalität, die auf eine Verbindung mit dem Server angewiesen ist, fehlt in der Kopie.

Falls ihr eine Möglichkeit sucht, Websites als Ganzes aus dem Web zu ziehen – also nicht nur eine, sondern alle Seiten –, dann empfehle ich eine Scraping-Software wie HTTrack.

Fussnoten

1) Selbstkritische Betrachtung: Bei meiner Website hier landen 57 Dateien auf der Festplatte, die um die 4,5 MB gross sind. Das ist im Vergleich zwar wenig, aber für meinen Geschmack noch immer viel zu viel.

Kommentar verfassen