Wie viele Festplatten braucht die Welt?

Wo stecken eigentlich die grossen Datenmengen auf dieser Welt? Diese Frage habe ich mir neulich gestellt und bin nach etwas googeln auf die Zusammenstellung Top 10 Largest Databases in the World 2018 gestossen. Die hält Überraschungen bereit. Die weltgrösste digitale Müllhalde (a.k.a. Facebook) hat es noch nicht einmal in die Liste geschafft. Youtube (a.k.a. die weltgrösste Müllhalde für bewegte Bilder) ist bloss auf Platz sieben. Google, auch so ein Datensammler und -horter, hat es immerhin auf Platz vier geschafft.

180815-harddrive.jpg
Eine allein reicht nicht. (Bild: Tookapic.com/CC0)

In der Liste gibt es auch Überraschungen: Amazon, zum Beispiel, auf Platz 8. Klar, in dem Online-Warenhaus gibt es viel Müll zu finden. Aber gleich so viel? Dann fällt einem natürlich ein, dass Amazon auch ein gigantischer Cloud-Anbieter ist: Amazon Web Services oder AWS ist das Stichwort dazu. Allerdings bin ich aufgrund der Beschreibung nicht einmal sicher, ob dieser Bereich eingerechnet ist oder ob die Datenmenge nur fürs eigentliche Geschäft Amazons gilt.

Ansonsten: Auf Platz 10 die Library of Congress, die in solchen Listen nie fehlen darf, weil die Amerikaner sehr stolz auf sie sind. Auf Platz 9 die NSA, die auch nicht fehlen darf, obwohl viele Amerikaner etwas weniger stolz auf sie sind. Auf Platz 6 ein Unternehmen namens ChoicePoint, das «Daten über Privatpersonen und Unternehmen sammelt», wie Wikipedia das beschreibt. Darauf sollte nun niemand stolz sein, nicht einmal das Unternehmen selbst. Der Platz 6 jedenfalls zeigt an, dass es das trotzdem recht erfolgreich tut.

Platz fünf Sprint, ein Telekom-Unternehmer, der mutmasslich auch etwas Vorratsdatenspeicherung betreibt – denn wie käme man sonst auf Platz fünf einer solchen Rangliste? Platz drei noch ein Telko, nämlich AT&T. Platz zwei geht an das National Energy Research Scientific Computing Center, das tatsächlich dazu da ist, riesige Datenmengen zu verarbeiten und dazu mehrere Supercomputer sein eigen nennt. Und Platz eins geht ans World Data Center for Climate, das nicht mal einen Wikipedia-Artikel vorzuweisen hat, aber dennoch Tera- und Petabyte-weise Daten hortet.

Bleibt die Frage: Wie glaubwürdig ist diese Rangliste? Dass bei der Klimaforschung immense Datenmengen anfallen, glaube ich sofort. Aber trotzdem – Facebook müsste in dieser Liste auftauchen, daran gibt es keinen Zweifel: Weltweit schieben dort täglich Hunderte Millionen Leute Daten hin, auch Fotos und Videos. In diesem Quora-Beitrag kommt der Autor in einer einigermassen überzeugenden Rechnung auf 1,86 GB pro Nutzer bzw. auf 922 Petabyte insgesamt. Das würde locker für Platz eins reichen.

Auch die 45 Terabyte an Videos bei Youtube scheinen mir extrem viel zu tief gegriffen. Quora gibt hier eine Vermutung von 10 Exabyte an – wobei ein Exabyte tausend Petabyte sind. Youtube wäre demnach speichermässig etwa zehnmal so gross wie Facebook. Und meinem Bauchgefühl nach kommt das auch etwa hin.

Und was ist mit Vimeo? Mit Soundcloud, Spotify oder Flickr? Mit der iCloud, mit Microsofts Datenzentren, der Dropbox, den vielen Geheimdiensten nebst der NSA? Den Banken, Steuerbehörden, Vorratsdatenspeicherungen, digitalen Kamera-Überwachungssystemen des öffentlichen Raums?

Und natürlich: Die Liste ignoriert auch die grossen Speichermengen, die für Erwachsenenunterhaltung so anfallen. Man könnte da an Netflix denken – wobei dort die täglich versendete Datenmenge vermutlich viel beeindruckender ist als die gespeicherte Datenmenge. Aber nein, natürlich meine ich mit diesem Euphemismus den Pornobereich. Für Nerdfunk 445 The internet is for Porn! habe ich mich mit der Statistik beschäftigt. Und da prahlt Pornhub, dass 2017 mehr als vier Millionen Videos hochgeladen wurden; mit einer Laufzeit von insgesamt beeindruckenden 68 Jahren. Und selbst wenn das nicht alles 4K-Material war, dann landen wir irgendwo im Bereich von 700 Terabyte bis einem Petabyte. Auch das reicht unbedingt für einen Listenplatz, zumal die Leute diese Site nicht erst seit letztem Jahr verwenden, sondern schon seit 2007 das Vergnügen haben, ihr Zeug dort abzuladen.

Fazit: Die Liste taugt nichts1. Wir können nicht einmal erahnen, wo welche Datenmengen schlummern. Ich nehme an, dass es Leute gibt, die eine Vorstellung davon haben. Aber die plaudern offensichtlich nicht. Von aussen lassen sich nur sehr grobe Abschätzungen vornehmen – und selbst die dürften falsch sein, weil wir nicht wissen, was an Metadaten, an Backups und an Verwaltungsdaten anfällt. Hier jedenfalls wird gesagt, dass bis 2025 der gesamte globale Datenbestand 163 Zettabyte gross sein wird. Ein Zettabyte sind noch einmal Tausend Exabyte. Oder anders ausgedrückt: Wenn man die 10 Exabyte von Youtube für realistisch hält, dann werden wir 2025 auf einem Datenberg von der Grösse von 16’300 Youtubes hocken.

Ist das nun viel oder wenig?

Footnotes

  1. Denkbar ist, dass sie Databases im engeren technischen Sinn meint und sich tatsächlich auf die Verwaltungsdaten bezieht und Nutzerdaten ausklammert. Aber das wäre halt nicht sonderlich interessant. ^top

Autor: Matthias

Diese Website gibt es seit 1999. Gebloggt wird hier seit 2007.

Kommentar verfassen