Type: Thesis
Type of Thesis: Doctoral Thesis
Title: Semi-automated extraction of information from large-scale historical maps
Authors: Schlegel, Inga 
Issue Date: 30-May-2023
Keywords: historical maps; information extraction
Abstract: 
Historical maps are important relics to reconstruct our past. New insights and information can be unveiled and make long-term morphological developments of different spatial environments understandable. As part of the investigation of urban areas, dynamics of settlements such as transformations of built-up areas or changes in road networks are of particular interest. However, detailed geographic information concerning urban history is way more accessible from large-scale historical maps than from other sources. Due to the great number and visual variety of available historical maps and the lack of appropriate tools, researchers still often revert to laborious manual means in the analysis and comparison of these. This thesis provides a comprehensive solution to semi-automatically unlock and retrieve geometrical as well as textual content from large-scale historical maps. Thus, the spatiotemporal exploration of a city’s individual buildings, roads, or water areas can be considerably improved.

Several shortcomings in this research field are addressed in this thesis. It is the first study to present a holistic concept for semi-automated extraction of geometric and semantic content from large-scale historical maps. Needs of users of historical maps are identified and evaluated in terms of a conducted user survey. The developed and demonstrated workflow is able to extract shapes of discrete map objects representing real-world equivalents as well as their labels. In addition, this thesis considers further processing of the extracted information: To be usable in geographic information systems, map objects are vectorized and labels are provided in the form of text strings. Spatial referencing creates the foundation to manage and store deduced data in databases and to assign additional knowledge. Therefore, an improved starting point for the comparison of historical maps with other geodata is provided. The developed workflow is applicable to comparable, typically monochrome, large-scale historical maps of similar complexity to the sample used for this thesis.

The central question this research pursues is how the extraction of information from large-scale historical maps can be facilitated to render them searchable, analyzable, and comparable with other maps. It is shown how objects and labels from simple scans of historical maps can be transferred into machine-readable data. With the help of object-based approaches, single map objects can be identified and differentiated based on the model of human perception, i.e., by means of various visual variables such as color, texture, and shape. Available tools for detecting and recognizing labels are used and amended with additional enhancements identified and developed for this thesis. Finally, further methodologies, e.g., from image processing, help to develop a novel and comprehensive approach for the extraction of information from large-scale historical maps. The involved processes benefit from each other and reduce human interaction and subjectivity, time, and labor to a necessary minimum.

As maps were and are still made to be viewed and interpreted by humans, automated methods taking into consideration principles of human perception generally achieve optimum results. Providing editable vector data of historical maps considerably contributes to their processability, analyzability, and comparability and thereby facilitates the daily work of historians, librarians, or urban researchers. An additional allocation of related semantic information allows users to search for keywords, juxtapose e.g., names of streets or measures of buildings, or simply analyze their persistence over time.

In conclusion, this thesis demonstrates the efficiency of comprehensive workflows for semi-automated information extraction from large-scale historical maps. It contributes to an improved transmission and perception of geographic information. By facilitating the comparison of urban geospatial data representing different times, spatiotemporal changes and developments in human history become more clearly recognizable.

Historische Karten sind wichtige Zeugnisse zur Rekonstruktion unserer Vergangenheit. Neue Erkenntnisse und Informationen sowie langfristige morphologische Entwicklungen verschiedener Teilräume können sichtbar und nachvollziehbar gemacht werden. Im Rahmen der Erforschung urbaner Strukturen sind Siedlungsdynamiken wie Veränderungen von bebauten Gebieten oder von Straßennetzwerken von besonderem Interesse. Mittels großmaßstäbiger historischer Karten sind detaillierte geographische Informationen zur Geschichte einer Stadt oft greifbarer als aus anderen Quellen. Aufgrund der großen Anzahl und visuellen Vielfalt historischer Karten sowie fehlender Tools greifen Forschende bei der Analyse und dem Vergleich dieser Karten noch immer auf mühsame manuelle Verfahren zurück. Diese Dissertation bietet einen umfassenden Lösungsansatz für die halbautomatisierte Extrahierung von geometrischen und semantischen Inhalten aus großmaßstäbigen historischen Karten. So wird die raumzeitliche Untersuchung einzelner Gebäude, Straßenzüge oder Wasserflächen einer Stadt erheblich verbessert.

Diese Arbeit befasst sich mit verschiedenen Defiziten innerhalb dieses Forschungsbereichs. Erstmalig wird ein holistisches Konzept für solch eine halbautomatisierte Extrahierung vorgestellt. Anhand einer Nutzerstudie werden Anforderungen an historische Karten ermittelt und evaluiert. Der demonstrierte Workflow ist in der Lage, diskrete Kartenobjekte, die reale Pendants darstellen, sowie deren Beschriftungen zu extrahieren. Darüber hinaus wird in dieser Arbeit die Weiterverarbeitung der extrahierten Informationen betrachtet: Kartenobjekte werden vektorisiert und Labels in Form von Textstrings bereitgestellt, um sie in Geographischen Informationssystemen nutzbar zu machen. Eine räumliche Referenzierung bietet eine Grundlage, um abgeleitete Daten in Datenbanken zu speichern und zu verwalten und um zusätzliche Informationen zuzuweisen. Damit wird eine verbesserte Ausgangslage für den Vergleich von historischen Karten mit anderen Geodaten geschaffen. Der entwickelte Workflow ist auf vergleichbare, in der Regel monochrome, großmaßstäbige historische Karten von ähnlicher Komplexität anwendbar.

Wie die Informationsextraktion aus großmaßstäbigen historischen Karten erleichtert werden kann, um diese durchsuchbar, analysierbar und mit anderen Karten vergleichbar zu machen, ist zentrale Frage dieser Arbeit. Es wird aufgezeigt, wie Objekte und Labels aus einfachen Scans historischer Karten maschinenlesbar gemacht werden können. Mithilfe objektbasierter Ansätze können einzelne Kartenobjekte anhand verschiedener visueller Variablen wie Farbe, Textur und Form identifiziert und differenziert werden. Etablierte Prozesse zur Erkennung von Labels werden angewandt und weiter verbessert. Der neuartige und umfassende Ansatz für die Informationsextraktion aus großmaßstäbigen historischen Karten wird durch zusätzliche Methoden, beispielsweise aus der Bildverarbeitung, ergänzt. Die implementierten Prozesse begünstigen einander und reduzieren die menschliche Interaktion und Subjektivität, Zeit und Arbeit auf ein notwendiges Minimum.

Da Karten damals wie heute für die Betrachtung und Interpretation durch den Menschen geschaffen wurden, erzielen automatisierte Verfahren, die an die menschliche Wahrnehmung angelehnt sind, die besten Ergebnisse. Die Verarbeitbarkeit, Analysierbarkeit und Vergleichbarkeit historischer Karten wird durch die Bereitstellung editierbarer Vektordaten maßgeblich verbessert und so die tägliche Arbeit von HistorikerInnen, BibliothekarInnen oder StadtforscherInnen unterstützt. Eine Zuweisung semantischer Informationen ermöglicht es Nutzenden beispielsweise nach Schlagwörtern oder Straßennamen zu suchen, Maße von Gebäuden abzuleiten oder deren Genese zu analysieren.

Diese Arbeit verdeutlicht die Effizienz eines solchen holistischen Ansatzes und trägt damit zu einer verbesserten Übermittlung und Wahrnehmung geographischer Informationen bei. Durch den Vergleich urbaner Geodaten verschiedener Epochen werden raumzeitliche Veränderungen und Entwicklungen der Menschheitsgeschichte deutlich.
Subject Class (DDC): 004: Informatik
HCU-Faculty: Geodäsie und Geoinformatik 
Advisor: Schiewe, Jochen 
Referee: Hurni, Lorenz
URN (Citation Link): urn:nbn:de:gbv:1373-repos-11333
Directlink: https://repos.hcu-hamburg.de/handle/hcu/888
Language: English
Related research data and publications: https://repos.hcu-hamburg.de/handle/hcu/890
https://repos.hcu-hamburg.de/handle/hcu/865
https://repos.hcu-hamburg.de/handle/hcu/889
Creative Commons License: https://creativecommons.org/licenses/by/4.0/
Appears in CollectionPublikationen (mit Volltext)

Files in This Item:
File Description SizeFormat
2023-05-30_schlegel-inga_dissertation.pdf17.45 MBAdobe PDFView/Open
Staff view

Page view(s)

501
checked on Mar 29, 2024

Download(s)

252
checked on Mar 29, 2024

Google ScholarTM

Check

Export

This item is licensed under a Creative Commons License Creative Commons