Digitalisierung
DFG-Projekt: Digitalisierung des »Polytechnischen Journals«
Die Deutsche Forschungsgemeinschaft (DFG) hat die Digitalisierung des von Johann Gottfried Dingler begründeten »Polytechnischen Journals« (1820–1931) von 2007 bis 2015 gefördert. Das beispiellose, europaweite Archiv der Technik-, Wissens- und Kulturgeschichte wurde in diesem Projekt des Instituts für Kulturwissenschaft der Humboldt-Universität zu Berlin frei im Internet verfügbar gemacht.
Arbeitsschritte der Digitalisierung
Das Ausgangsmaterial umfasst 375 Bände mit etwa 205.000 Seiten, über 280 Mio. Zeichen und insgesamt ca. 3.500 Abbildungen und 3.600 Tafeln. Die Arbeitsschritte von der Erfassung der Zeitschrift bis zur Online-Präsentation wurden in Kooperation mit der Sächsischen Landesbibliothek Dresden (SLUB) und dem Digitalisierungs-Dienstleister Editura GmbH durchgeführt.
1. Bilddigitalisierung
Im Digitalisierungszentrum der SLUB Dresden arbeiten ausgebildete Fachkräfte mit der allerneuesten Technologie. Jeder Band wurde dort vorausgehend kollationiert und auf Besonderheiten (aufklappbare Bildtafeln, zerstörte Seiten, Notizzettel etc.) geprüft. Dann wurden die Bände des »Polytechnischen Journals« in chronologischer Reihenfolge von einem Scanroboter der Firma Qidenus Technologies Wien abfotografiert. Das ermöglichte eine hochaufgelöste Digitalisierung in Vollfarbe bei einem Öffnungswinkel von nur ca. 60 Grad, wodurch die Bände stark geschont werden konnten.
Eine Ausnahme stellten hier einige Bände aus den Anfangsjahren der Zeitschrift dar. Diese sind teilweise so fest gebunden, dass sie händisch gescannt werden mussten, da noch nicht einmal der ansonsten notwendige Öffnungswinkel von 60 Grad erreicht werden konnte.
2. Texterkennung und Textauszeichnung
Die Volltexterkennung und automatische Aufnahme der Metadaten wurde durch den erfahrenen Digitalisierungsdienstleister Editura GmbH realisiert. Die Texterkennung per OCR beinhaltete gleichzeitig die Auszeichnung diverser struktureller Merkmale per ›tagging‹. Diese Auszeichnung des Textes ermöglichte später eine Volltextansicht des Dokumentes und geht weit über die Möglichkeiten von schlicht mit dem Text hinterlegten Images hinaus.
3. Wissenschaftliche Bearbeitung und Nutzbarmachung
Die Textauszeichnung wurde nach einer Analyse von Nutzungsszenarien noch tiefer granuliert, um den gezielten Zugriff auf die Digitalisate zu ermöglichen. So entstand eine hochwertige, komfortable und öffentlich zugängliche Datenbank mit großem wissenschaftlichem Mehrwert gegenüber der gedruckten Version.