PDF-Dokumente durch die Mangel drehen

Die Webanwendung auf pdftoword.com wandelt PDF-Dateien in Worddokumente um. Die Resultate sind nicht über jeden Zweifel erhaben, aber dennoch kann dieser Dienst ganz nützlich sein

PDF-Dateien lassen sich bekanntlich im kostenlosen Adobe Reader weder bearbeiten, noch in ein anderes Format überführen (wenn man von der Exportmöglichkeit als unformatiertem Text absieht). Sollte eine PDF-Datei inhaltlich bearbeitet werden, muss man sich entweder die teure Adobe Acrobat-Software anschaffen, die mit rund 500 Franken zu Buche schlägt. Etwas billiger kommt man mit einem Produkt von Jaws davon.

Eine kostenlose Alternative stellt die Website pdftoword.com dar. Mit ihrer Hilfe wandelt man PDF-Dateien in Word-Dokumente oder ins Rich-Text-Format (RTF) um. Die resultierende Datei lässt sich dann bearbeiten und weiterverwenden.

111223-pdftoword-com01.jpg
Datei auswählen, Zielformat und Mailandresse angeben – und schon geht pdftoword.com ans Werk.

Das ist in manchen Fällen hilfreich, kann aber dennoch nur als Notlösung gelten. Der Grund liegt darin, dass die PDF-Datei als digitales Faksimile dient, das das ursprüngliche Dokument zwar bezüglich Gestaltung akkurat abbildet, aber keinerlei Informationen über die Struktur des ursprünglichen Dokuments enthält. Anstelle von fortlaufendem Text gibt es in der PDF-Datei lediglich einzelne Textzeilen (die manchmal auch pro Zeile noch in Blöcke zerlegt sind), die sich nur gesondert bearbeiten lassen. Auch die hierarchische Gliederung nach Überschriften verschiedener Ebenen oder funktionale Unterscheidungen (Legenden, Seitenzahlen, o.ä.) gehen verloren – in der PDF-Datei bleibt nur die Position der Bilder und Textblöcke auf der Seite erhalten.

Nachbearbeitung ist unvermeidlich
Dieses Manko kann auch pdftoword.com nicht aus der Welt schaffen: Im konvertierten Dokument stimmt der Textfluss u.U. nicht. Es kann auch vorkommen. Formatierungen werden verfälscht und es gibt keine Zuordnung von Druckformaten wie «Überschrift 1» oder «Fliesstext». Auch Tabellen können komplett durcheinander geraten. Das heisst, dass man unter Umständen viel Zeit in die Korrektur und Nachbearbeitung investieren muss, bevor aus der umgewandelten Datei ein brauchbares Dokument wird. Dennoch – falls kein Zugriff auf die Ursprungsdatei besteht, aus der die fragliche PDF-Datei erstellt wurde, ist der Weg über die umgewandelte PDF-Datei allemal schneller und weniger nervenzerreibend, als eine Rekonstruktion von Grund auf.

111223-pdftoword-com02.jpg
Links die Seite aus dem «Tagesanzeiger», rechts die umgewandelte PDF-Datei. Optisch überzeugt das Resultat, aber strukturell hat die Word-Datei einige Defizite.

Das Umwandeln über die Website ist denkbar unkompliziert. Im Schritt eins wählt man die umzuwandelnde PDF-Datei aus. Im Schritt zwei gibt man an, ob man eine Word-Doc-Datei oder eine Rich-Text-Datei wünscht. Im dritten Schritt ist eine E-Mail-Adresse anzugeben. Die Umwandlung erfolgt nämlich nicht sofort, sondern je nach Kapazität der Server-Software.

Am Schluss ist Warten angesagt
In unserem Testlauf mussten wir eine gute halbe Stunde auf die Zustellung der fertigen Datei warten.

Der Dienst ist kostenlos und auch die in der PDF-Datei enthaltenen Bilder wurden bei unserem Test beibehalten. Die «Tagesanzeiger»-Seite aus InDesign hätte in der umgewandelten Form zur Nachbearbeitung viel Aufwand gemacht.

Bei der Nutzung ist zu beachten, dass es PDF-Dateien mit Schutzfunktionen gibt, bei denen die Umwandlung nicht möglich ist.

Autor: Matthias

Diese Website gibt es seit 1999. Gebloggt wird hier seit 2007.

Kommentar verfassen