Digitalisierung


DFG-Projekt: Digitalisierung des »Polytechnischen Journals«

Die Deutsche Forschungsgemeinschaft (DFG) hat die Digitalisierung des von Johann Gottfried Dingler begründeten »Polytechnischen Journals« (1820–1931) von 2007 bis 2015 gefördert. Das beispiellose, europaweite Archiv der Technik-, Wissens- und Kulturgeschichte wurde in diesem Projekt des Instituts für Kulturwissenschaft der Humboldt-Universität zu Berlin frei im Internet verfügbar gemacht.


Arbeitsschritte der Digitalisierung

Das Ausgangsmaterial umfasst 375 Bände mit etwa 205.000 Seiten, über 280 Mio. Zeichen und insgesamt ca. 3.500 Abbildungen und 3.600 Tafeln. Die Arbeitsschritte von der Erfassung der Zeitschrift bis zur Online-Präsentation wurden in Kooperation mit der Sächsischen Landesbibliothek Dresden (SLUB) und dem Digitalisierungs-Dienstleister Editura GmbH durchgeführt.

1. Bilddigitalisierung

Im Digitalisierungszentrum der SLUB Dresden arbeiten ausgebildete Fachkräfte mit der allerneuesten Technologie. Jeder Band wurde dort vorausgehend kollationiert und auf Besonderheiten (aufklappbare Bildtafeln, zerstörte Seiten, Notizzettel etc.) geprüft. Dann wurden die Bände des »Polytechnischen Journals« in chronologischer Reihenfolge von einem Scanroboter der Firma Qidenus Technologies Wien abfotografiert. Das ermöglichte eine hochaufgelöste Digitalisierung in Vollfarbe bei einem Öffnungswinkel von nur ca. 60 Grad, wodurch die Bände stark geschont werden konnten.

Eine Ausnahme stellten hier einige Bände aus den Anfangsjahren der Zeitschrift dar. Diese sind teilweise so fest gebunden, dass sie händisch gescannt werden mussten, da noch nicht einmal der ansonsten notwendige Öffnungswinkel von 60 Grad erreicht werden konnte.

Hut
Abb. 1: Bilddigitalisat aus einer Journalseite (Bd. 1, 1820, S. 374). Das Faksimile aus Dinglers »Polytechnischem Journal« dient als Vorlage zur weiteren Verarbeitung.

2. Texterkennung und Textauszeichnung

Die Volltexterkennung und automatische Aufnahme der Metadaten wurde durch den erfahrenen Digitalisierungsdienstleister Editura GmbH realisiert. Die Texterkennung per OCR beinhaltete gleichzeitig die Auszeichnung diverser struktureller Merkmale per ›tagging‹. Diese Auszeichnung des Textes ermöglichte später eine Volltextansicht des Dokumentes und geht weit über die Möglichkeiten von schlicht mit dem Text hinterlegten Images hinaus.

XML/TEI-Code
Abb. 2: Bei der Texterfassung werden textuelle Daten erfasst. Anschließend bzw. schon während dieses Arbeitsschrittes werden Format- und Strukturinformationen in die XML/TEI-Datei eingetragen.

3. Wissenschaftliche Bearbeitung und Nutzbarmachung

Die Textauszeichnung wurde nach einer Analyse von Nutzungsszenarien noch tiefer granuliert, um den gezielten Zugriff auf die Digitalisate zu ermöglichen. So entstand eine hochwertige, komfortable und öffentlich zugängliche Datenbank mit großem wissenschaftlichem Mehrwert gegenüber der gedruckten Version.