Möglichkeiten der Datenvisualisierung

Exponat 1: Ein Blick aus der Vogelperspektive auf die Trierer Apokalypse

Was macht man mit 183.000 Seiten?

(Autorin: Hannah Busch, 15.05.2016)

Seit den 90er Jahren ist das Potential computergestützter Analysemöglichkeiten stetig gewachsen, doch erst durch die zahlreichen Digitalisierungsprojekte, die seit etwa 20 Jahren weltweit durchgeführt werden, und das World Wide Web, das uns von überall Zugriff auf diese Digitalisate verschafft, eröffnen sich neue Chancen für die quantitative kodikologische Forschung. Digitale Abbildungen jeder einzelnen Seite ermöglichen uns einen Blick aus der Vogelperspektive auf einen einzelnen Kodex, den man sonst zunächst aus der Bindung lösen und vor sich ausbreiten müsste, oder auch auf mehr als tausend Jahre Handschriftengeschichte. Wir stellen hierzu zwei Exponate vor:

Eine Bildmontage der sogenannten Trierer Apokalypse (Stadtbibliothek/Stadtarchiv Trier, Hs. 31) lässt auf einen Blick erkennen, wie sich Bild- und Textseiten abwechseln und an welchen Stellen dieses Schema durchbrochen wird. Hierfür kann es verschiedene Erklärungen geben: Möglich sind der Beginn eines neuen Abschnittes, ein Textabschnitt, der nicht auf der vorgegebenen Seite unterzubringen war oder ein Fehler in der Lagenkonstruktion.

Die zweite Montage zeigt circa 6000 Handschriftenseiten aus mehr als tausend Jahren Geschichte der Bibliothek der Abtei St. Matthias. Deutlich lässt sich hier die Vielfalt des Bestandes und die Einheit des Layouts innerhalb einer Texteinheit erkennen.

Beide Montagen sind von Arbeiten des amerikanischen Künstlers und Wissenschaftlers Lev Manovich inspiriert worden und zeigen eindrucksvoll, welche neuen Blicke die Digitalisierung auf unser Kulturgut ermöglichen kann. Durch die Untersuchung scheinbar banaler Merkmale lassen sich Forschungsfragen beantworten, auf die allein in Detailstudien kaum eingegangen werden könnte.

Exponat 2: Montage von ca. 6000 Manuskriptseiten.

VISUALISIERUNG VON KATALOGDATEN

Für das menschliche Auge ist es schwierig bis unmöglich, die Inhalte von Dateien, die hauptsächlich Quellcode enthalten, zu erfassen und auf einen Blick zu verstehen. Visualisierungen und Grafiken sind seit Beginn der schriftlichen Kommunikation ein beliebtes Mittel, um Informationen kompakt und verständlich zu übermitteln. Es ist zudem erwiesen, dass sich das menschliche Gedächtnis leichter Inhalte über Bilder als Inhalte über Text verinnerlichen kann.

Bisher mangelt es allerdings an grafischen Oberflächen, die die entstehenden hochdimensionalen Metadaten großer Bestände wie des Bestandes des Virtuellen Skritopriums St. Matthias visualisieren können. Mittels Visualisierungen wird es geisteswissenschaftlichen Forschern ermöglicht, Zusammenhänge zwischen den Handschriften einfach zu erkennen und neue Erkenntnisse aus den Daten zu gewinnen.

Zur Beantwortung zentraler Fragestellungen der historischen Forschung werden die Handschriften des St. Mattheiser Bestandes analysiert und insbesondere die verschiedenen Bestandteile des Layouts, wie beispielsweise Seitengröße, Schrift- und Bildraum, vermessen. Die meist manuelle Analyse ist jedoch sehr zeit- und arbeitsintensiv, sodass nur eine geringe Anzahl mittelalterlicher Handschriften auf diese Art und Weise untersucht werden kann. Mit Hilfe digitaler Methoden und Werkzeuge können vorhandene Digitalisate automatisch oder halbautomatisch ausgewertet werden. Im Gegensatz zum manuellen Ansatz kann in diesem Fall mit einer signifikanten Verbesserung im Hinblick auf Schnelligkeit, Genauigkeit sowie Reproduzierbarkeit gerechnet werden. Bisher mangelt es allerdings an grafischen Oberflächen, die die entstehenden hochdimensionalen Metadaten großer Bestände visualisieren können. Als Mehrwert wird es geisteswissenschaftlichen Forschern ermöglicht, Zusammenhänge zwischen Handschriften einfach zu erkennen und neue Erkenntnisse aus den Daten zu gewinnen.

Die Abbildung  zeigt das Visualisierungsframework CodiVis, das die Erforschung von Korrelationen im abstrakten Merkmalsraum digitalisierter mittelalterlicher Handschriften des St. Mattheiser Bestandes vereinfacht und unterstützt. Nach Einspeisung der Digitalisate in das Datenrepositorium CodiStore können mit Hilfe von SWATI (Software Workflow for the Automatic Tagging of Images) verschiedene Layoutmerkmale der Handschriftenseiten bestimmt sowie die bibliografischen Metadaten extrahiert werden. Für einen schnellen Überblick über den gesamten Datenbestand und eine gleichzeitige Darstellung der zugehörigen Handschriftendetails wird eine Kombination zweier Visualisierungsarten angeboten. Auf der linken Seite ist der Bestand mit Hilfe eines radialen Baumdiagramms geordnet und nach dem Jahrhundert der Entstehung illustriert. Auf der rechten Seiten werden die extrahierten Merkmale Schriftraum, Seitenhöhe und Seitenbreite mittels paralleler Koordinaten dargestellt. Die verschiedenen Linien repräsentieren dabei die spezifischen Ausprägungen der Layoutmerkmale einzelner Handschriften. Zur Untersuchung der Korrelationen werden Markierungen im Radialbaum automatisch in die Ansicht der parallelen Koordinaten übernommen.
Innerhalb von CodiVis werden für Analysezwecke zwei Vorgehensweisen zur Markierung von Daten angeboten. Einerseits können Nutzer, verschiedene Knoten im Radialbaum markieren, die auf der unteren Ebene einzelnen Manuskripten oder auf der oberen Ebene Manuskriptclustern entsprechen. Diese Markierungen werden automatisch in der Ansicht der parallelen Koordinaten reflektiert und die entsprechenden Manuskripte hervorgehoben. Andererseits können, wie in Abbildung 3 dargestellt, auch Teile der vertikalen Achsen der parallelen Koordination ausgewählt werden. In diesem Fall werden die entsprechenden Manuskripte in der Tabellenansicht hervorgehoben.