11 research outputs found

    ProSA - Using the CHASE for Provenance Management

    Get PDF
    Collecting, storing, tracking, and archiving scientific data is the main task of research data management, being the basis for scientific evaluations. In addition to the evaluation (a complex query in the case of structured databases) and the result itself, the important part of the original database used has also to be archived. To ensure reproducible and replicable research, the evaluation queries can be processed again at a later point in time in order to reproduce the result. Being able to calculate the origin of an evaluation is the main problem in provenance management, particularly in why and how data provenance. We are developing a tool called ProSA which combines data provenance and schema/data evolution using the CHASE for the different database transformations needed. Besides describing the main ideas of ProSA, another focus of this paper is the concrete use of our CHASE tool ChaTEAU for invertible query evaluation

    ChaTEAU: A Universal Toolkit for Applying the Chase

    Get PDF
    What do applications like semantic optimization, data exchange and integration, answering queries under dependencies, query reformulation with constraints, and data cleaning have in common? All these applications can be processed by the Chase, a family of algorithms for reasoning with constraints. While the theory of the Chase is well understood, existing implementations are confined to specific use cases and application scenarios, making it difficult to reuse them in other settings. ChaTEAU overcomes this limitation: It takes the logical core of the Chase, generalizes it, and provides a software library for different Chase applications in a single toolkit

    Ausblick auf einen erweiterten CHASE-Algorithmus

    Get PDF
    Der CHASE ist ein grundlegender Algorithmus der Datenbanktheorie, der ĂŒber noch ungenutztes Potential hinsichtlich seiner praktischen Umsetzung in Systemen verfĂŒgt. In den von uns untersuchten Anwendungsbereichen wurden mehrere ProblemfĂ€lle identifiziert, fĂŒr die der CHASE interessant sein könnte. Allerdings sind diese Anwendungsbereiche mit zahlreichen Datenbankkonzepten wie komplexeren Anfrageoperationen verbunden, die bisher nicht (gemeinsam) in den CHASE integriert wurden. Die Erweiterung des CHASE um diese Anfrageoperationen, wie Negation, allgemeine Vergleiche oder Aggregatfunktionen, muss jedoch kontrolliert erfolgen, um EffektivitĂ€t, Konfluenz und Terminierung des CHASE nicht zu gefĂ€hrden und so eine effektive Anwendung des Algorithmus auf praktisch relevante ProblemfĂ€lle zu ermöglichen. Um Auswirkungen von CHASE-Erweiterungen einschĂ€tzen zu können, mĂŒssen zunĂ€chst Effizienz, Konfluenz, Terminierung und EffektivitĂ€t des bisher etablierten CHASE verstanden und gegebenenfalls nĂ€her untersucht werden. In dieser Arbeit stellen wir erste Erkenntnisse hinsichtlich Terminierung und Konfluenz des Standard-CHASE zusammen

    Der BACKCHASE zur UnterstĂŒtzung von Data Provenance und Schema-Evolution

    Get PDF
    Der CHASE-Algorithmus ist ein Multifunktionswerkzeug der Datenbankforschung. UrsprĂŒnglich fĂŒr die Optimierung des Datenbankentwurfs genutzt, wird er heutzutage auch fĂŒr den Datenaustausch und Data Cleaning verwendet und kann ebenfalls genutzt werden, um Anfragen zu optimieren. FĂŒr einige Anwendungen reicht eine CHASE-Phase alleine jedoch nicht aus. Teilweise wird eine Nachbearbeitung, eine sogenannte BACKCHASE-Phase, benötigt. Dies ist beispielsweise der Fall, wenn Auswertungen zum Zweck der RĂŒckverfolgbarkeit (Provenance) invertiert werden sollen. In dieser Arbeit fassen wir zusammen, wie der Ansatz des CHASE und BACKCHASE verwendet werden kann, um die Why-Provenance von Anfragen unter Schema-Evolution zu gewĂ€hrleisten

    Data Provenance

    Get PDF
    Wir werden eine grafische BenutzeroberflĂ€che fĂŒr das Forschungsprojekt ProSA entwickeln. Das Ziel von ProSA ist die Bestimmung der fĂŒr ein Anfrageergebnis notwendigen, minimalen Quelldaten im Rahmen von Provenance Management. ProSA nutzt das Java-Tool ChaTEAU, um aus der Quell-Datenbank und einer SQL-Anfrage die minimale Teildatenbank zu bestimmen. ChaTEAU bekommt eine s-t tgd in Form eines XML-Dokuments und auf dessen Basis wird mit seiner Implementierung der Chase-Algorithmus zwei Mal ausgefĂŒhrt. Nach der ersten AusfĂŒhrung hat man das Anfrageergebnis beziehungsweise die Ergebnisinstanz. Beim zweiten AusfĂŒhren von ChaTEAU wird als Eingabe die Inverse Anfrage genommen und als Ergebnis erhĂ€lt man dann die minimale Teildatenbank. Außerdem werden mithilfe des Provenance-Typs und der SQL-Anfrage Provenance-Berechnungen durchgefĂŒhrt, dessen Ergebnisse dann mit der minimalen Teildatenbank kombiniert werden. Diese wird dann in der von uns entwickelten BenutzeroberflĂ€che von ProSA ausgegeben

    Nutzung von ChaTEAU fĂŒr das Answering-Queries-using-Views-Problem (AQuV)

    Get PDF
    Die vorliegende Arbeit beschĂ€ftigt sich mit dem Ziel, Anfragen auf Datenbanken nur ĂŒber Sichten zu beantworten. Das Finden von Ă€quivalenten Anfragen auf Sichten ist nicht von einfacher Natur. Es gibt eine handvoll Algorithmen, mit denen diese Anfragen umgeschrieben werden können. Ein Verfahren ist der CHASE&BACKCHASE. Diese Arbeit beschĂ€ftigt sich mit diesem Verfahren und seinen Optimierungen. Das Ziel dieser Arbeit ist es, den CHASE&BACKCHASE und den Provenance-Directed CHASE&BACKCHASE in ChaTEAU zu implementieren. Das Hauptaugenmerk liegt hierbei auf der provenance-basierten Variante

    Provenance Management unter Verwendung von Schemaabbildungen mit Annotationen

    Get PDF
    Ziel des Promotionsprojekts ProSA (Provenance Management using Schema Mappings with Annotations) ist die Anwendung und Verallgemeinerung von Techniken des Provenance-Managements im Bereich des Forschungsdatenmanagements unter Verwendung des mit zusÀtzlichen Provenance-Informationen erweiterten Chase&Backchase.The goal of the PhD project ProSA (Provenance Management using Schema Mappings with Annotations) is to apply and generalize provenance management techniques in the field of research data management using Chase&Backchase enhanced with additional provenance
    corecore