Seit 2004 scannt Google den Buchbestand grosser US-amerikanischer Bibliotheken, indiziert den Inhalt der Werke und stellt sie in durchsuchbarer Form auf books.google.com zur Verfügung. Es gibt auch Kooperationen mit Verlagen, durch die Google Bücher als PDF-Datei zur Verfügung gestellt bekommt und diese in den globalen Suchindex eingliedern kann. Mit Google Books scheint die Vision des kollektiven Gedächtnisses in greifbare Nähe zu rücken…
Die Recherche mit der Google-Books-Website indes ist bis heute alles andere als praktisch gelöst – gerade für wissenschaftliche Zwecke. Darum liegt die Idee nicht fern, ein Buch zu Recherchezwecken als Ganzes herunterzuladen, um mit ihr lokal arbeiten zu können.
Der Download klappt. Aber…
Verschiedene Programme versprechen genau das. Das Download-programm von gbooksdownloader.com existiert für Windows und Mac, und lädt ein Buch als einzelne Grafikdateien, wobei jede Datei einer Buchseite entspricht. Das Programm von hactheplanet.com existiert nur für Mac OS X und bietet die Auswahl, das Dokument als PDF oder als einzelne PNG-Bilddateien zu speichern. Beide Programme erfüllen ihren Zweck – mit einigen gewichtigen Einschränkungen allerdings:
- Die Bücher sind oft nicht vollständig. Das liegt daran, dass Titel, deren Urheberrecht nicht abgelaufen ist, nur in Auszügen verfügbar sind. Da ist dann natürlich auch nur ein lückenhafter Download möglich.
- Die Bücher sind nach dem Download nicht durchsuchbar. Heruntergeladen werden nur die Scans, d.h. Faksimiles der einzelnen Seiten.
Gegen die erste Einschränkung lässt sich nichts ausrichten. Falls du für Recherchen nur einzelne Kapitel oder Seiten benötigst, ist es Glückssache, ob die fraglichen Informationen im heruntergeladenen Buch enthalten sind.
Für die Suche braucht es OCR
Das zweite Problem lässt sich relativ einfach lösen, falls du Adobe Acrobat in der Vollversion zur Verfügung hast: Diese Software führt eine OCR-Texterkennung durch und hinterlegt den Faksimiles die Textinformationen: Das ermöglicht ein Durchsuchen mit der Suchfunktion in Acrobat oder in Adobe Reader. Um die OCR-Erkennung zu veranlassen, klick in Acrobat X auf Werkzeuge und dann unter Texterkennung auf In dieser Datei.
Interessante Tipps zum Umgang mit Google Books finden sich auf Wikisource.org.