Springe direkt zu Inhalt

Datenmanagement

Datenmanagement ist ein zentraler Bestandteil eines methodischen Arbeitens mit dem eMAEX-Ansatz, das darauf zielt, deskriptive Analysen und Annotationsdaten mit audiovisuellen Bildern zu verschränken und verfügbar zu machen. Die Archivierung der unterschiedlichen Forschungsdaten und des analysierten Materials sowie dessen Präsentation in vergleichender Perspektive bildet eine zentrale Aufgabe. Ziel ist es, unsere Forschungsdaten im Sinne der FAIR-Prinzipien (Findable, Accessible, Interoperable, Reusable) zugänglich zu machen.

Datenbank (CMS)

Zur anschaulichen und überprüfbaren Darstellung einer Datenmatrix des Hollywood-Kriegsfilms wurde ein Content-Management-System-basiertes multimediales Publikationssystem in Zusammenarbeit mit dem Center für digitale Systeme der FU (Cedis) entwickelt, dessen Datenstruktur der methodischen Systematik folgt. Die Daten zu den einzelnen Filmen lassen sich so entlang der unterschiedlichen Pathoskategorien sortieren und erschließen. Vergleichende Studien können dadurch auf verschiedenen Ebenen der Segmentierung audiovisueller Inszenierung durchgeführt werden. Die Datenmatrix als multimediale Darstellungsform vereint Videoclips mit Textbeschreibungen und Diagrammen.

Darüber hinaus wurde die Datenmatrix auch in einem Semantic MediaWiki angelegt und ergänzt. Das Wiki, das zur Bearbeitung einen Login erfordert, wird ebenfalls für weitere Forschungsprojekte (bspw. zum deutsch-türkischen Kino) genutzt, um einzelnen Filmszenen Pathoskategorien bzw. narrative Topoi oder Motive zuzuordnen und die Daten nach diesen Konzepten zu sortieren.

Annotationsinfrastruktur im AdA-Projekt

Im AdA-Projekt wurde in der interdisziplinären Zusammenarbeit auf verschiedene netzbasierte Dienste zurückgegriffen. Die Korpusstudie und kollaborative Annotationspraxis des AdA-Projekts fußt zentral auf einer Serverinfrastruktur. Mit dieser lässt sich der Videokorpus verwalten, wobei dies auch Prozesse der einheitlichen Transcodierung und Verknüpfung mit Metadaten umfasst. Außerdem lassen sich rechenintensive automatische Videoanalysen durchführen. Schließlich kann das systematische Annotationsvokabular der maschinenlesbaren AdA-Filmontologie sowie die auf dieser Grundlage erstellten semantisch strukturierten Linked Open Data-Annotationen gespeichert werden. Das Datenmodell der Ontologie basiert darauf, dass jedes Konzept und jede Annotation einen eindeutigen Bezeichner (Unique resource identifier – URI) hat. Auf jeden einzelnen Eintrag kann durch Abrufen der URI online zugegriffen werden. Annotiert wird hingegen mit der Open-Source-Annotationssoftware Advene lokal auf dem Computer. Mit GitHub wiederum können Annotationsdaten und die Softwareentwicklung synchronisiert werden. Die Ergebnisse sind öffentlich zugänglich: https://github.com/ProjectAdA. Der Datensatz des AdA-Projekts wurde darüber hinaus auch auf Zenodo veröffentlicht.

Setup des AdA-Projekts

Setup des AdA-Projekts
Bildquelle: Agt-Rickauer et al. 2018

Seit Projektende werden kommerzielle Server-Anbieter und Videoportale verwendet, um die entwickelte Annotationsinfrastruktur weiter zu nutzen. Serverseitig im Backend sind die Metadaten in einer Graphdatenbank (Triplestore) gespeichert. Mit dem zur Präsentation und Exploration entwickelten AdA Annotation Explorer können die Annotationsdaten abgerufen, gefiltert und mit den audiovisuellen Bildern synchron visualisiert werden. Für letzteres bildete die Open-Source-Software FrameTrail von Joscha Jäger die Grundlage, die es erlaubt, interaktive Videos und damit verlinkte Inhalte direkt im Browser anzusehen. Der AdA Annotation Explorer wurde über eine entkoppelte Client-Server-Architektur mit RESTful API realisiert, die auf offene Standards für den Datenaustausch und auf Verwendung von Open-Source-Komponenten setzt.

Architektur des AdA Annotation Explorers

Architektur des AdA Annotation Explorers
Bildquelle: Agt-Rickauer et al. 2022