INFO.RO Förderpreis für die Beste Bachelorarbeit 2021/2022 (01.06.2023)

v.l.: Prof. Michael Fellmann (stv. Vorsitzender INFO.RO) und Preisträgerin B.Sc. Anja Wolpert, Foto: Wolfram Bütow

Provenienz beschreibt Informationen über Entitäten, Aktivitäten und Personen, die an der Erstellung von Daten oder anderen Dingen beteiligt waren, die zur Beurteilung ihrer Qualität, Zuverlässigkeit oder Vertrauenswürdigkeit dienen. In wissenschaftlichen Studien, wie z.B. Simulationsstudien, ist die Provenienz von Daten und anderen Produkten essentiell, um ihre Herkunft nachzuvollziehen und ihre Reproduzierbarkeit zu gewährleisten, was das Vertrauen in die Ergebnisse der Studien erhöhen und eventuelle Fehler aufdecken kann. Traditionell wird Provenienz manuell aufgezeichnet, zum Beispiel in Notizbüchern, Reports oder auch mithilfe von graphischen Editoren. Mit zunehmender Datenmenge und Komplexität von Studien – oder beliebigen anderen komplexen Prozessen – wird es jedoch immer schwieriger oder sogar unmöglich, den Überblick zu behalten und alle Schritte lückenlos zu dokumentieren. Daher ist es von großem wissenschaftlichen und praktischen Interesse, die Provenienz automatisch aufzuzeichnen.

Bisherige Ansätze der automatischen Provenienzaufzeichnung beschäftigen sich jeweils nur mit einzelnen Aspekten von Prozessen, z.B. den Daten. Bezüglich Simulationsstudien befasst sich bisher nur ein einziger Ansatz mit der Provenienz ganzer Simulationsstudien, einschließlich Konzeption, Modellbildung und -verfeinerung und der Ausführung verschiedenster Simulationsexperimente. Dieser nutzt einen artefaktbasierten Workflow, um den Modellierer bei seinen Aktionen zu leiten und Provenienz aufzuzeichnen. Mit dieser Methode wird der Modellierer jedoch in seinem Handlungsspielraum eingeschränkt und muss seine Arbeitsweise an die durch den Workflow vordefinierten Schrittfolgen und bereitgestellten Werkzeuge anpassen.

Ziel der Bachelorarbeit war es daher, eine leichtgewichtige, nicht-intrusive Methode zu entwickeln, die den Modellierer in seiner gewohnten Arbeitsumgebung beobachtet und so die Provenienz transparent, mit so wenig Restriktionen wie möglich aufzeichnet. Die Methode basiert auf einer modularen Architektur aus sogenannten „Capturern“ und einem „Model Builder“. Die Capturer sind spezialisiert auf das Aufzeichnen von Information aus einem einzigen Tool, z.B. Python, Visual Studio Code oder der Konsole. Bei der Konzeption der Capturer sind verschiedene Ansätze aus der Literatur eingeflossen. Die von den Capturern gesammelten Informationen werden über eine Schnittstelle an den Model Builder übermittelt. Dieser kennt das zugrundeliegende Provenienz-Datenmodell und kann so die jeweiligen Entitäten, Aktivitäten und Abhängigkeiten ableiten und alles zu einem gerichteten, azyklischen Graphen zusammensetzen. Das Konzept wurde in Java implementiert und anhand einer Fallstudie mit einem Räuber-Beute-Modell demonstriert. Der resultierende Provenienz-Graph wurde mit dem Ergebnis des workflowbasierten Ansatzes verglichen. Der Vergleich zeigte, dass Frau Wolpers mit ihrer leichtgewichtigen, nicht-intrusiven Methode in der Lage ist, alle ausgeführten Schritte korrekt aufzuzeichnen, mit nur minimalen Nutzereingaben. Abschließend diskutierte Frau Wolpers wichtige offene Fragen, wie z.B. welche Rolle die Granularität der Provenienzinformation spielt, und lieferte Impulse bezüglich möglicher Erweiterungen ihrer Methode.

Der Preis wurde auf einer Festveranstaltung vom Vorstand des Vereins Informatik-Forum Rostock e.V. – INFO.RO von Prof. Dr. rer. pol. Michael Fellmann (stv. Vorsitzender) im Beisein von Professorinnen und Professoren, Mitarbeitenden, Promovierenden und Studierenden der Informatik-Institute überreicht.

Der Preis wird vom Verein Informatik-Forum Rostock e.V. (INFO.RO) seit dem Jahr 2012 jährlich für eine am Institut für Informatik entstandene hervorragende Bachelorarbeit an Studierende der Fakultät für Informatik und Elektrotechnik vergeben. Der Preis ist mit 100 Euro dotiert.


Back