So werden unsere Daten die nächsten 500 Jahre überdauern

Ich habe die Frage zu beantworten, auf welche Weise eine digitale Audioaufnahme so gelagert werden kann, dass sie auch unseren Nachfahren und späteren Generationen noch Freude bereiten wird – keine ganz einfache Aufgabe!

Es ist endlich an der Zeit, eine alte Schuld einzulösen. Franziska hat mich nämlich anfangs Jahr gefragt, wie man Audio-Aufnahmen möglichst dauerhaft speichert. So, dass sie auf unabsehbare Zeit noch verwend- und anhörbar sind. Ich habe ihr eine Antwort darauf versprochen, bin ihr die bis jetzt aber schuldig geblieben. Zumindest in ausführlicher Form Ein paar summarische Hinweise habe ich mir bereits entlocken lassen.

Es geht um das Projekt Hörschatz von Franziska von Grünigen und Gabriela Meissner, das ich grossartig finde. Es wird auf der Website hoerschatz.ch wie folgt beschrieben:

Wenn Kinder ihre Eltern verlieren, verblassen die Erinnerungen je nach Alter der Kinder schnell: «Wer war meine Mutter? Wer war mein Vater?»

Mit einer sehr persönlichen Audiobiografie hinterlassen früh verstorbene Eltern ihren minderjährigen Kindern eine Erinnerung für die Ewigkeit. In eigenen Worten und individueller Auswahl der Episoden erzählen Palliativ-PatientInnen ihren Familien, was ihnen wichtig ist, was von ihnen bleiben soll. Eine Audiobiografie ist eine Ode ans Leben und die Liebsten vor dem Abschied für immer.

Diese Autobiografien sind kostbar und dürfen auf keinen Fall einem jener banalen Ereignisse zum Opfer fallen, die gemeinhin Datenverlust auslösten: Benutzerfehler, Hardwareversagen oder ein Ausfall bei der Cloud. Darum ein paar Überlegungen, wie man das verhindert – wobei ich die Aufgabe grosszügig ausgelegt und mir Gedanken mache, wie eine solche Autobiografie nicht für eine Generation, sondern für mehrere Generationen erhalten bleiben könnte. Denn wer von uns würde nicht gern die Stimme der Urgrossmutter oder des Ururgrossvaters hören? Ich fände das grossartig!

Diese Diashow benötigt JavaScript.

Und darhum hier meine zwei Cent zu dieser Frage, wobei die Expertinnen und Experten  aus der Leserschaft noch so herzlich aufgefordert sind, Ergänzungen und Kommentare anzubringen. Schliesslich liegt das Problem bei dieser Frage darin, dass wir eine Prognose hinsichtlich der Zukunft abgeben müssen. Und das ist eine schwierige Konstellation, wie wir von Mark Twain wissen.

Meine erste Idee wird manche überraschen: Es war der Vorschlag, zumindest zusätzlich zur digitalen Speicherung auch ein analoges Medium beizulegen. Da es darum geht, eine Audioaufnahme für die Nachwelt aufzubewahren, wäre eine Vinylschallplatte eine charmante Ergänzung. Die speichern nicht nur ein Tonsignal auf eine Art und Weise, dass man es mit simplen Mitteln und ganz ohne Datenträgerquerelen, Audioformat-, Codec- und Konvertierungsprobleme hörbar machen kann.

Sehr leicht zugänglich – und obendrein cooool!

Eine solche Platte lässt sich auch in einer Auflage von einem Exemplar günstig schneiden. Ich habe das im August 2011 mit zwei meiner Radiobeiträge gemacht, und zwar via drdub.com im Österreichischen Fieberbrunn. Ich verstehe bis heute nicht warum, ich das damals nicht bebloggt habe – es war nämlich supercool, eine Vinylschallplatte mit meinen eigenen Aufnahmen zu bekommen. 49 Euro habe ich damals dafür bezahlt und mir scheint, dass die Preise seitdem mehr oder weniger die gleichen geblieben sind.

Zwei Probleme gibt es mit dieser Methode: Erstens muss man eine Vinylschallplatte sorgfältig lagern, damit sie die Zeit überdauert: Kühl, trocken, im Inlay und stehend im Regal. Natürlich sollten sie nicht allzu schlimm zustauben und keinen spielenden Kindern in die Hände fallen.

Zweitens ist die Kapazität einer Schallplatte begrenzt. Der Preis von Für zwölf Minuten pro Seite zahlt man derzeit bei Dr. Dub 45 Euro. Für 18 Minuten sind es 70 Euro, für 24 Minuten sogar 90 Euro – und selbst mit total 48 Minuten müsste sich Franziska für ihr Projekt sehr kurzfassen.

Wie sie mir gesagt hat, sind die Hörschatz-Aufnahmen länger; einige Stunden normalerweise. Sie liessen sich auf Spulentonbändern analog sichern; aber ich habe auf die Schnelle keinen Dienstleister gefunden, der das tut. Falls jemand dazu einen Tipp hat, gerne als Kommentar!

Datenträger sind nur wenige Jahre haltbar

Wenn wir bei der digitalen Speicherung bleiben, dann beginne ich meine Ausführungen mit einem Verweis auf meinen Beitrag Daten für die Ewigkeit, der beim Tagi zum Glück auch in digitaler Form seit 2014 überlebt hat. Hier heisst es zu der Lebensdauer der einzelnen Speichermedien folgendes:

Die durchschnittlichen Datenträger sind nur wenige Jahre bis Jahrzehnte haltbar. Das gilt für Festplatten. Sie beginnen schon nach drei Jahren zu schwächeln. (…) Magnetbänder haben eine Lebensdauer von 30 bis 50 Jahren. Sie sind jedoch nicht für den Privatgebrauch vorgesehen. Speicherkarten und SSD-Speicher überdauern als Archivmedium zwischen 5 bis 10 Jahre.

Es gibt dauerhaftere Medien, aber die sind nicht für den normalen Einsatz gedacht und meist nicht mit vernünftigem Aufwand zu verwenden und mutmasslich so teuer, dass sich die Nutzung verbietet. Neulich habe ich beim SRF die schöne Meldung gelesen, dass Forscher Daten in Form von DNS ablegen wollen.

Das hat mehrere Vorteile, erstens die extreme Kompaktheit eines Datenspeichers:

«Man kann unvorstellbar hohe Dichten erreichen und somit kleine Speichermedien entwickeln», sagt Robert Grass, Chemieingenieur und Dozent an der ETH Zürich.

Zweitens eben die Haltbarkeit:

Der Speicher ist über tausende Jahre stabil. So können Wissenschaftler die DNS von Lebewesen auslesen, die vor mehr als 100’000 Jahren gestorben sind.

Allerdings ist die Speicherung als DNS bislang weder erschwinglich noch praktikabel. Darum bleibt nur der Weg, uns mit den herkömmlichen Medien zu behelfen. Und wie gesagt: Die haben allesamt eine so beschränkte Lebensdauer, dass man keinem von ihnen über den Weg trauen darf.

Vom alten Speichermedium aufs neue

Es bleibt also nur die Methode, diese sehr beschränkt haltbaren digitalen Schätze regelmässig von einem nicht mehr ganz frischen auf ein brandneues Speichermedium zu kopieren. Das klingt nun nach einer mühsamen Fleissaufgabe, an die man obendrein immer rechtzeitig denken muss. Aber ich glaube, dass es auch einfach und quasi nebenbei geht.

Ich stelle mir das konkret so vor: Wenn man eine wichtige Audio-Aufnahme zu hüten hat – oder irgendwelche Datenbestände, zum Beispiel den Bestand an Digitalfotos von Eltern oder Grosseltern, den man als Erbe anvertraut bekommen hat –, dann sollte man diese Daten nicht einfach auf einem Datenträger in die Schublade schieben oder im Estrich versorgen.

Stattdessen legt man auf seiner eigenen Festplatte einen entsprechenden Ordner an, in dem man diese Daten ablegt. Auf diese Weise wandern sie in den aktiv bewirtschafteten Datenbestand, den man nicht aus den Augen verliert: Man sichert ihn mit den gerade aktuellen Methoden, wobei es ganz gleichgültig ist, ob dazu die Cloud, externe Festplatten, SSDs oder meinetwegen auch noch DVDs oder Blu-rays zum Einsatz kommen. Und die sorgfältige Datensicherung ist die beste und einzig verlässliche Methode gegen Datenverlust.

Daran müssen wir uns eh gewöhnen

Ich denke, das entspricht ganz gut den Gewohnheiten, die wir uns in den letzten Jahren gerade auch wegen unserer Handyfotos angeeignet haben: Wer nicht möchte, dass diese Bilder nach ein paar Jahren wieder verloren sind, der braucht eine Strategie, um all die Dinge, die sich im Lauf der Jahre in digitaler Form akkumulieren, auf dem Lebensweg mitzunehmen.

Natürlich wird dieser Datenbestand mit den Jahren immer grösser. Aber zum Glück ist die Kapazität der Speichermedien viel stärker gewachsen, sodass es heute ein Klacks ist, ein paar Terabyte persönlicher digitaler Errungenschaften zu verwalten und jeweils vom alten auf den neuen Computer zu transferieren und bei Technologiesprüngen auf das jeweils nächste Speichermedium zu übertragen.

Zusätzilche Sicherheit gibt ein analoges Speichermedium: Eine Audiodatei liesse sich auf diesem Datenträger hier elegant und ohne grosse technische Hürden abspeichern (Guillaume Techer, Unsplash-Lizenz).

Denken wir das weiter: Diese Methode lässt sich nicht nur für uns selbst, sondern auch generationenübergreifend anwenden – selbst wenn das im Moment noch alles ziemlich vage ist, weil wir die erste Generation überhaupt sind, die Daten in derartigen Mengen hortet.

Die Datenübergabe wird zur Tradition

Ich nehme an, dass sich eine Tradition herausbilden wird, dass diese Daten von einer Generation auf die nächste übertragen wird. Ich wäre sehr gern Zeitreisender und würde mir ansehen, wie sich das in Hundert Jahren eingespielt haben wird. Im Moment haben wir noch keine Erfahrungswerte, noch nicht einmal mit den sozialen Medien (siehe dazu auch Eine Zeitkapsel für das Internet und Warum unsere Facebook-Posts uns überleben sollten).

Entsprechend muss dafür jeder von uns selbst Sorge tragen und sich überlegen, wann und wie er seine digitalen Schätze an seine Nachfahren übergeben will. Vielleicht einfach in Form des Passworts, mit dem man sich am Computer anmeldet. Falls man ein exzessiver Nutzer der Cloud ist, muss man auch das Masterpasswort zum Passwortmanager vererben. Denn nur anhand der vorhandenen Passwörter haben die Nachfahren eine Vorstellung, was wo im Internet steckt und mit welchen Zugangsdaten sie daran herankommen.

Ordnung muss sein. Und ein Inhaltsverzeichnis braucht es

Sinnvoll bei der Vererbung der digitalen Habe sind zwei Dinge, denke ich:

Erstens sollte die Dateiablage so strukturiert ist, dass die Töchter und Söhne, Enkelinnen und Enkel sich darin auch zurechtfinden und nicht aufs Geratewohl Tausende von Dateien durchstöbern müssen. Ich empfehle  daran zu denken, jene Dinge, die die Nachfahren nicht sehen sollen, zu verschlüsseln (Datengeheimnisse wahren) oder zumindest in einem eindeutig benannten Ordner zu platzieren. (Ich gehe davon aus, dass sich die Nachkommenschaft daran halten und einen Bogen um diesen Ordner machen würde. Denn wer will schon die Pornosammlung seiner Eltern oder Grosseltern sehen! 😨)

Zweitens wäre eine Art Inhaltsverzeichnis sinnvoll: Also eine Aufstellung, was man während seines Lebens als Nutzer und Sammler digitaler Daten angehäuft hat, wo die wichtigen Dinge stecken und welchen langweiligen Kram man getrost ignorieren darf. In dieses Inhaltsverzeichnis müssten die Daten, Aufnahmen, Bilder und Dokumente hervorgehoben werden, die man selbst zur treuhänderischen Aufbewahrung anvertraut bekommen hat.

Auf diese Weise müsste das Unterfangen klappen, das ich vielleicht etwas pathetisch als einen intergenerativen Stafettenlauf beschreibe, bei dem unsere digitalen Hinterlassenschaften der Zukunft entgegengetragen werden und auch in hundert oder zweihundert Jahren noch da sind. Natürlich unter der Voraussetzung, dass auch die Menschheit und ihre Technologie so lange durchhält.

Ein kurzer Einschub: Es gibt Clouddienste mit einem Angebot für den digitalen Nachlass, zum Beispiel beim Schweizer Unternehmen securesafe.com. Sinnvoll, aber ich würde mich nicht allein darauf verlassen, weil man bei Unternehmen auch nicht wissen kann, wie lange ihre Lebensdauer ist. Darum würde ich ein solches Abo allenfalls zusätzlich zu den hier beschriebenen Methoden buchen.

Die Krux der zukunftstauglichen Dateiformate

Es bleibt ein zweites Problem: nämlich die Frage nach den zukunftstauglichen Dateiformaten. Die Erhaltung der Dateien nützt nichts, wenn die Formate nicht mehr geöffnet werden können. Auch hier gilt natürlich, dass wir nicht wissen, wohin sich die Zukunft entwickelt und was überdauert und was nicht.

Drei Dinge kann man aber als gegeben betrachten:

Erstens: Weit verbreitete Formate sind besser als exotische Spezialitäten. JPG-Dateien werden sicherlich auch in Hundert Jahren noch nutzbar sein – bei exotischen RAW-Formaten ist das sehr viel weniger wahrscheinlich. Darum empfehle ich, Digitalfotos nicht nur in diesem Rohdatenformat zu archivieren, sondern als normale JPG-Dateien. Und wenn das RAW-Format unverzichtbar ist, dann sollte man die ganze Sammlung zusätzlich in JPG-Form vorhalten.

Weit verbreitet sind auch PDF, MP3 und MP4 und noch einige weitere, die ich bei Gelegenheit zusammentragen werde.

Zweitens: Offene Standards sind den proprietären Formaten unbedingt vorzuziehen. Die Tücken der Formate, die von einem einzelnen Hersteller entwickelt wurden, zeigt sich exemplarisch bei Microsofts DOC-Format von Word: Ich habe im Beitrag Digitale Auferstehung aufgezeigt, dass es schon nach 25 Jahren aufwändig sein kann, eine Datei überhaupt zu öffnen.

Das ist mit der neueren Variante Docx einfacher, da diese Dateien aus Standardformaten wie XML zusammengesetzt sind. Allein deswegen lohnt es sich, alte DOC-Dateien nach Docx zu konvertieren.

Drittens: Simple Formate sind besser als komplexe. Das kann bedeuten, dass man eine Datei nicht immer auf die effizienteste Art und Weise archiviert. Aber ein einfach strukturiertes Format lässt sich eher konvertieren oder einem Reverse Engineering unterziehen als eines, das mit komplizierten Algorithmen «ausgepackt» werden muss.

Das gilt zum Beispiel für Audiodateien: Eine unkomprimierte WAV-Datei ist im Vergleich zum MP4 riesig. Aber ein einigermassen begabter Informatikstudent wäre in der Lage ein Programm zu schreiben, dass eine solche Datei wiedergibt. Bei einer MP3-Datei bräuchte er die Hilfe einiger Mitstudenten und vermutlich auch vom Prof.

Darum empfehle ich für Audiodateien, die die Zeit überdauern müssen, simpel WAV; auch wenn ich davon ausgehe, dass MP3, MP4 und auch Flac in den nächsten Jahrzehnten nicht in Vergessenheit geraten werden.

Auch beim Format bietet Redundanz zusätzliche Sicherheit: Man verwendet beispielsweise eine MP3-Datei, weil sie unkompliziert in der Handhabung ist und hält im Archiv die unkomprimierte WAV-Datei vor, weil die auch in Zukunft und für alle kommenden Revolutionen im Bereich des digitalen Audios die bestmögliche Qualität bieten wird.

Beitragsbild: Datensicherung über die Generationen hinweg nach dem Prinzip der Stafette (Pexels, Pixabay-Lizenz).

Autor: Matthias

Computerjournalist, Familienvater, Radiomensch und Podcaster, Nerd, Blogger und Skeptiker. Überzeugungstäter, was das Bloggen angeht – und Verfechter eines freien, offenen Internets, in dem nicht alle interessanten Inhalte in den Datensilos von ein paar grossen Internetkonzernen verschwinden. Wenn euch das Blog hier gefällt, dürft ihr mir gerne ein Bier oder einen Tee spendieren: paypal.me/schuessler

7 Gedanken zu „So werden unsere Daten die nächsten 500 Jahre überdauern“

  1. Wenn man Bedenken hat, ob das Dateiformat in Zukunft noch lesbar sein wird, sollte man dessen Spezifikation ebenfalls archivieren. Und einen Player bzw. Viewer, aber nicht nur in kompilierter Form, sondern auch den Sourcecode. Denn ein C-Programm wird man ziemlich sicher auch noch in hundert Jahren kompilieren können, während dem eine heutige x64-EXE auf dem dann aktuellen Quantenrechner nicht mehr läuft. 🙂

      1. Selbst mit der guten alten CDR (Gold) gibt es 700 MByte, bei MP3 (besser OGG) ergeben sich auf einer Scheibe viele viele Stunden. ISO9660-Dateiformat läuft bis heute auf sämtlichen Rechnerwelten (inkl. auf meinem Mac Mini Testrechner, siehe dazu):

        https://archivista.ch/cms/de/aktuell-blog/aepfel-willkommen

        Ich habe Datenträger seit 1988 im CDR-Fromat (ISO9660), all meine Dokumente (seit 1977, gescannt 1988) habe ich in Tiff, PNG oder im JPG Format. Die damals gescannten Belege in 150dpi Graustufe/Farbe reichen „locker“, um selbst Schriften mit 4 Punkt zu lesen. PDF wollte/konnte ich nie empfehlen, das gab bzw. gibt noch heute immer wieder Probleme mit der Datenhaltung (z.B. änderten mit der Einführung des Euros alle Zeichensäzte, die damaligen PDF-Dateien enthalten heute fehlerhafte Schriften).

        Wer mehr als 700 MByte haben möchte bzw. Filme archivieren möchte, findet im Archival M-Disk Format einen „würdigen“ Nachfolger. 100 GB bieten einen genügenden Spielraum, um selbst 4K sauber in MP4 (H264) zu archivieren. Zu den M-Disks hier:

        https://archivista.ch/cms/de/aktuell-blog/blogs-2020/2020-ii-mit-mdisc-support

        Unter Verwendung ISO9660 und M-Disk und gängiger Datenformate ist schon viel erreicht. Wer zu den Dateien „digitale“ Listen anlegt, landet früher oder später bei einer Archivlösung. Die Kunst bei einer kleinen privaten Lösung dürfte sein, dass die Kosten nicht „ausufern“. Das Rückkopieren auf einen analogen Datenträger kann ein Ansatz sein, preislich ist das aber meist (wie oben dargelegt) wenig lukrativ und die Pflege der Archivmedien entfällt dabei auch nicht.

        Ich habe zwischen 1980 und 2005 einige Tausend Dia-Bilder fotografiert und verschlossen gelagert. Ich wollte diese zwar bereits 2006 archivieren, aus familiären Gründen klappte es jedoch erst anfangs 2021. Erstaunlicherweise waren die Bilder bis 2000 kein Problem, alles danach, da gab es (obwohl alles Kodak Ektachrome) erhebliche Probleme (ab 2000 brach der Absatz von Diafilmen wohl weg, wahrscheinlich wurde billiger produziert).

        Etwa die Hälfte der neueren Dias „erblindeten“, d.h. sie wurden partiell oder fast ganz scharz. Das gleiche Phänomen konnte ich auch bei der Sammlung meines Vaters feststellen, welcher von 1960 ebenfalls bis ca. 2002 analog fotografierte. Immerhin, von ca. 6000 Dias konnten ca. 5800 „gerettet“ werden (die halbschwarzen konnten softwaretechnisch restauriert werden).

        Ich empfehle folglich sehr, mit der Konvertierung des analogen Materials nicht beliebig lange zu warten. Dies gilt für alle analogen Materialien (es spircht nichts dagegen, die gescannten Daten danach nicht zusätzlich aufzubewahren). Aber wer nicht digitalisiert, muss sich einfach bewusst sein, gerade bei Negativen, das hält nicht ewig. Ich meinte 50-60 Jahre wie bei meinem Vater ist nicht schlecht, aber ewig hält es nicht.

        Dass die Sourcen (Programme) mitarchiviert werden sollten, versteht sich von selbst, da es ansonsten schwierig ist, die Daten zu lesen. Beispiel: Ich habe 1995 einige Hundert Disketten mit einem Dos-Programm archiviert, von dem ich dummerweise die Sourcen nie hatte.

        All diese tollen Programme, Windows 2.x, 3.x, Corel 1.x, WordPerfect, all diese Schätze hab ich zwar (und es würde virtualisiert auch laufen, nur das „dumme“ Disk-Extraktionsprogramm (QCopyPro) läuft virtualisiert nicht. Ich kann die Rohdaten zwar „halbwegs“ entschlüsseln, aber eben nicht ganz. Daher, die Sourcen sind enorm wichtig und darum „stehe“ ich so auf Open Source 😉

  2. Du schreibst unter anderem: „Spulentonbändern analog sichern“. Glaubst Du, dass es in zehn Jahren noch ein Gerät gibt, mit dem man diese Spulentonbändern abspielen kann?

  3. Von dieser Marke Ballfinger hatte ich noch nie gehört. Sieht sehr, sehr teuer aus. Ist ein Nischen-Nischen-Produkt. Ich überlege mir, ob ich eine Wette mir Dir eingehen soll, dass dieser Firma die nächsten 10 Jahren nicht überlebt. 😉

Kommentar verfassen