thesis

Überführung des klinischen Datenbestandes des Datenintegrationszentrums Greifswald in eine Graphdatenbank – Eignungsuntersuchung und Umsetzung

Abstract

Im Rahmen der 2015 ins Leben gerufenen Medizininformatik-Initiative des Bundesministeriums für Bildung und Forschung sollten die Möglichkeiten der zunehmenden Digitalisierung für die medizinische Forschung und Patientenversorgung nutzbar gemacht werden. Als ein Baustein dieser Bestrebungen entstanden in der Folge an den Standorten der Universitätskliniken Deutschlands Datenintegrationszentren (DIZ), in denen klinische Daten aus den unterschiedlichen Quell-Systemen der Kliniken des jeweiligen Standortes zusammengeführt wurden, um sie so der medizinischen Forschung für Datenanalysen zur Verfügung zu stellen. Die Speicherung und Bereitstellung der Daten des DIZ Greifswald erfolgt bisher unter Nutzung relationaler Datenbanken, was für Forschende verschiedene Erschwernisse und Einschränkungen hinsichtlich der Datenabfrage und -analyse mit sich bringen kann: Beispielsweise gestaltet sich die Abfrage einer relationalen Datenbank mittels Abfragesprache für ungeübte Anwender kompliziert und komplexe Zusammenhänge zwischen verschiedenen Daten lassen sich nur unter großem Aufwand berechnen und erkennen. Graphdatenbanken hingegen nutzen einen anderen Ansatz zur Speicherung und Ausgabe von Daten -- statt in Tabellen erfolgen Speicherung und Darstellung in Form von Graphen. Letztere können visuell ausgegeben werden, was die Datenexploration und -Interpretation erleichtern kann. Eine Bereitstellung des klinischen Datensatzes des DIZ Greifswald in einer Graphdatenbank könnte daher der Wissenschaft neue Blickwinkel auf die vorhandenen Daten und deren Zusammenhänge ermöglichen sowie dazu beitragen, den Datensatz auch für informationstechnisch weniger geübte Anwender leichter zugänglich zu machen. Auf diesem Wege könnte ein Beitrag dazu geleistet werden, die Entstehung und Therapie von Krankheiten besser zu verstehen und die Patientenversorgung zu verbessern. Ziel der vorliegenden Arbeit war es, den derzeit in Form von relationalen Datenbanken gespeicherten klinischen Datenbestand des DIZ Greifswald auf seine Eignung für eine Transformation in eine Graphstruktur zu analysieren. Hierfür mussten zum einen derzeit vorhandene Datenbanken und Schnittstellen technisch analysiert werden. Zum anderen waren die Daten auch unter medizinischen Gesichtspunkten bezüglich ihres Potentials zur Darstellung mittels Graphen zu überprüfen. Daran anschließend sollte ein Prozess für die Überführung der zuvor als geeignet identifizierten Daten in eine Graphdatenbank entwickelt und umgesetzt werden. Schließlich war über das Aufzeigen von Anwendungsfällen zu ermitteln, ob die Bereitstellung der Daten über eine Graphdatenbank medizinisch Forschenden die erhofften Vorteile bringen kann. Nach eingehender Analyse der Architektur und der Schnittstellen des DIZ Greifswald konnten die klinischen Daten des Forschungsrepositorys zunächst mittels der eigens entwickelten Explorations-Software fhir-inspect komfortabel und übersichtlich untersucht werden. Es zeigte sich, dass die Daten vielfältig untereinander verknüpft waren und medizinische Daten von hohem wissenschaftlichen Wert enthielten. Eine Überführung des Datenbestandes in eine Graphdatenbank versprach zahlreiche Analysemöglichkeiten auch für Forschende mit weniger IT-Erfahrung. Im Anschluss erfolgte die Entwicklung eines Konzepts für einen Prozess, der die zur Verfügung stehenden Daten in eine benutzerfreundliche Graphstuktur transformieren und in einer Graphdatenbank ablegen konnte. Dieser Prozess wurde daraufhin in der eigens entwickelten Software fhir2neo4j implementiert. Mittels fhir2neo4j wurde der Datenbestand des DIZ Greifswald anschließend erstmals erfolgreich in eine Graphstruktur überführt. Es konnte gezeigt werden, dass die Ursprungsdaten in eine komplex verknüpfte Graphstruktur transformiert wurden und der so entstandene Graph Zusammenhänge zwischen den Daten intuitiv erfassbar aufzeigen kann. Anhand von Anwendungsfällen wurde schließlich dargestellt, dass der so entstandene medizinische Datensatz vielfältiges Potential zur Datenexploration und -Analyse bietet und die visuelle Präsentation der Ergebnisse als Graph einen großen Mehrwert gegenüber tabellarischen Darstellungen aufweist. Im Vergleich zur bisherigen Abbildung des klinischen Datensatzes in einer relationalen Datenbank ermöglicht die im Ergebnis der vorliegenden Arbeit erzeugte Graphstruktur erleichterte Analysen und Abfragen auch zu komplexen Fragestellungen. Die Möglichkeit der Darstellung von Abfrageergebnissen als Graph eröffnet neue Wege, Zusammenhänge zwischen klinischen Daten intuitiv zu erfassen. Der konzipierte Überführungs-Prozess und die Software fhir2neo4j haben das Potential, medizinisch Forschenden neue Blicke auf große klinische Datenbestände zu ermöglichen und somit zur Grundlage für vielfältige wissenschaftliche Erkenntnisse und die Verbesserung der Patientenversorgung beizutragen

    Similar works