Archaeoinformatics - Data Science

BA: Verortung von Fotodateien aus dem Kieler Stadtarchiv auf der Basis von Textlabels

Supervisors:

Prof. Dr. Matthias Renz

Christian Beth, M.Sc.

Abstract

Viele Institutionen besitzen historisch gewachsene Datensammlungen mit hohem Informationsgehalt, die aufgrund ihrer Form jedoch oft nur manuell verarbeitet werden können. Durch die Anreicherung mangelhaft strukturierter Datenbestände mit strukturierten Metadaten können für diese Datenbestände moderne Verfahren der automatisierten Erkenntnisgewinnung erschlosssen werden. In dieser Arbeit wird am Beispiel der Fotodatenbank des Kieler Stadtarchivs ein Verfahren entwickelt, mit dessen Hilfe automatisiert die in den den Fotos zugeordneten Textlabels vorkommenden Ortsangaben extrahiert und in einer strukturierten Form als zusätzliche Metadaten bereitgestellt werden können. Dazu werden die Textlabels auf das Vorkommen von Ortsbezeichnungen untersucht, welche dann durch Untersuchung ihres sprachlichen Kontextes weiter spezifiziert werden. Zusätzlich werden die erkannten Verortungen georeferenziert. Das Verfahren kann zu ca. 61% der vorliegenden Fotos eine Verortung extrahieren. Durch die Verortung und Georeferenzierung der Fotos können neue Nutzungsmöglichkeiten für die Sammlung, wie z.B. eine geographische Suche im Archivbestand ermöglicht werden. Das Beispiel zeigt, dass die automatisierte Aufbereitung größerer Datenbestände eine Alternative zur manuellen Strukturierung darstellen kann – oder sie zumindest stark vereinfacht.