Gut versteckte Webbeute

Ich gehöre zu denen, die recht häufig Webseiten archivieren. Wobei ich damit meine, dass ich in Firefox den Befehl Datei > Speichern unter betätige und die Seite dann in einem Verzeichnis in der Festplatte verräume. Das ist zwar aufwändiger als das Anlegen eines Lesezeichens. Aber es hat den unschlagbaren Vorteil, dass die Informationen greifbar bleiben, auch wenn es dem Urheber des Artikels gefallen sollte, diesen vom Netz zu nehmen oder irgendwohin zu verschieben, wo ihn niemand mehr findet.

Bislang habe ich in Firefox als Dateityp «Websteite komplett» gewählt und die lokale Datei dann von meinem Progrämmchen HTML Stripper durch die Mangel drehen lassen. Nun habe ich aber die überaus nützliche Erweiterung Mozilla Archive Format entdeckt. Sie speichert Webseiten als MAFF-Datei. Das ist an sich nichts anderes als eine ZIP-Datei, die alle Informationen enthält. Man kann sie bei Bedarf auch mit WinZIP öffnen und unerwünschte Dinge rauslöschen. So wird man Werbebanner, Javascript-Dateien oder Flash-Ballast los. Übrigens, darf ich an dieser Stelle mal die Frage in die Runde werfen, ob diejenigen Webgestalter eigentlich noch ganz richtig im Kopf sind, die zum Teil 500 KB oder mehr an Javascript-Code in eine einzige Seite einbauen oder verlinken. Früher gab es doch einmal die schöne Regel, dass eine Webseite inklusive allen Anhangs nicht mehr als 50 KB gross sein sollte. Zugegeben, daran halte ich mich mit Clickomania.ch seit Einführung von Flatpress auch nicht mehr, aber eine gewisse Mässigung wäre doch nicht verkehrt. Was JavaScript angeht, predige ich seit Jahren Askese, allerdings ohne dass irgend jemand auf mich hören würde.

Jedenfalls hat das Archivieren mit Mozilla Archive Format auch den Vorteil, dass auch über CSS platzierte Hintergrundbilder gesichert werden und sogar die Import-Statements in den CSS Berücksichtigung erfahren. Firefox mit dem Standard-Speicherverfahren ignoriert diese Dinge, sodass die lokal gesicherte Version gerade bei Seiten aus Blog-Systemen und CMSses teilweise falsch und teilweise komplett unleserlich sind. (Das erleichtert übrigens auch das Ausspionieren der CSS-Dateien und Gestaltungstechniken anderer Leute.)

Das ist noch nicht alles: Man kann auch problemlos mehrere Seiten in einem Archiv speichern. Dazu klickt man mit der rechten Maustaste auf einen Reiter und wählt Alle Tabs speichern unter…. Das Resultat ist eine MAFF-Datei, in der alle offenen Seiten archiviert werden. Öffnet man diese MAFF-Datei, werden diese Seiten wiederum als Tabs geöffnet. Man kann beim Archivieren und Recherchieren alle Informationen auf einen Schlag speichern und wiederherstellen. Ich brauche das häufig, um Informationen zu sammeln, die ich später offline auswerte, beispielsweise auf einer längeren Zugfahrt.

Auch die Originaladresse wird eingebettet, sodass man die Seite bei Bedarf online ansehen kann. Sogar Zoom-Stufen, History und die Scroll-Position wird gespeichert, wenn man die Option Save extended metadata in MAFF archives einschaltet.

Und zu guter Letzt kann die Erweiterung auch MHTML-Dateien des Internet Explorer (MHT) öffnen.

Fazit: Eine durchdachte Erweiterung, die Datensammlern und Rechercheuren das Leben ungemein erleichtert. Und mich sogar dazu bringt, meinem eigenen Progrämmchen den Rücken zu kehren.

Autor: Matthias

Diese Website gibt es seit 1999. Gebloggt wird hier seit 2007.

2 Gedanken zu „Gut versteckte Webbeute“

  1. Ich habe seit kurzem Windows 7 auf meinem Rechner und arbeite mit Firefox Version 3.6.13. Für eine im Maff-Format gespeicherte Seite fand sich kein voreingestelltes Programm zum Öffnen/Aufruf der gespeicherten Dateien. Ich hätte die Datei(sammlung) mit einem “Entzipper” öffnen können, das hielt ich aber für sehr unkomfortabel. Abhilfe schafft hier die Installation des Firefox Addons für maf-Dateien auf http://maf.mozdev.org/

Kommentar verfassen