Pl4net.info

Bibliothekarische Stimmen. Independent, täglich.

12. Mai 2020
von André Davids
Kommentare deaktiviert für Die Texterkennung als Herausforderung bei der Digitalisierung von Tabellen

Die Texterkennung als Herausforderung bei der Digitalisierung von Tabellen

Bereits seit mehr als 5000 Jahren finden Volkszählungen statt. Während sie ursprünglich nur zur Steuererhebung und zu militärischen Zwecken durchgeführt wurden, dienten sie später auch der wissenschaftlichen Forschung. Die ersten Zählungen, die von Anfang an auch der Forschung zur Verfügung standen, wurden 1846 unter der Leitung von Adolphe Quetelet in Belgien durchgeführt. Diese Zählungen wurden in regelmäßigen Abständen wiederholt. Da die Analyse dieser Zählungen aufgrund ihres Umfanges und ihres Formats sehr aufwendig ist, ist es sinnvoll, die dort enthaltenen Informationen mit Hilfe von Retrodigitalisierung und elektronischer Texterkennung aufzubereiten. Die wirtschaftswissenschaftliche Bibliothek der KU Leuven (Belgien) arbeitet zur Zeit an einem Projekt, das sich zum Ziel gesetzt hat, die gedruckten Ausgaben der belgischen Industriezählungen von 1846 bis 1947 als Excel-Kalkulationstabellen anzubieten. In diesem Artikel wird sowohl auf die damit verbundenen Herausforderungen eingegangen als auch die Arbeitsweise beschrieben.