Erweiterung des ProSA-Parsers.

Abstract

Das Tool ProSA dient dem Forschungsdatenmanagement, dabei wird insbesondere eine minimale Teildatenbank einer ursprünglich größeren Forschungsdatenbank berechnet. Dadurch kann die zu veröffentlichende Datenmenge reduziert werden. Gleichzeitig werden aber auch genau die Teile der Datenbank ermittelt, die notwendig sind, um das Forschungsergebnis zu reproduzieren. ProSA nutzt für diese Berechnung u.a. den CHASE-Algorithmus, ein Universalwerkzeug der Datenbanktheorie. Der CHASE arbeitet allerdings mit sog. Abhängigkeiten (egds, tgds, s-t tgds) und nicht mit Anfragen, die in SQL geschrieben werden, was sonst meistens genutzt wird, um Anfragen an Datenbanken zu formulieren. Der sog. Parser in ProSA (auch genannt sql2sttgd) löst dieses Problem bereits ansatzweise: einfache SQL-Anfragen können automatisch in Abhängigkeiten umgewandelt werden. In dieser Arbeit wird die Funktionalität des ProSA-Parsers erweitert, nämlich um Aggregatfunktionen. Dafür wird eine Übersicht gegeben, zu welchen Operatoren aus SQL theoretische Konzepte bestehen, um sie als Abhängigkeiten darzustellen. Es wird gezeigt, welche dieser Konzepte bereits implementiert wurden. Ein bestehendes Konzept zu Aggregatfunktionen wird vereinfacht und um Gruppierungen erweitert. Darüber hinaus wird ein Ansatz vorgestellt, mit dem auch Anfragen behandelt werden können, die Aggregatfunktionen zusammen mit Verbunden und Selektionen enthalten. Für einfache Aggregatfunktionen wird das angepasste Konzept im ProSA-Parser implementiert

    Similar works