9 research outputs found

    Bauckmann, Jana

    No full text

    Efficiently Identifying Inclusion Dependencies in RDBMS

    No full text
    In large integration projects one is often confronted with poorly documented databases. One possibility to gather information on database schemas is to search for inclusion dependencies (IND). These provide a solid basis for deducing foreign key constraints—as they are pre-condition for potential (semantically valid but missing) foreign key constraints. In this paper we present and compare several algorithms to identify unary INDs. The obvious way is to utilize an appropriate SQL statement on each potential IND to test its satisfiedness. We show that this approach is not efficient enough for large databases. Therefore, we developed database-external approaches that are up to several magnitudes faster than a SQL based approach. We tested our algorithms on databases of up to 3 GB with about 1200 attributes, which can be analyzed by our software in approximately 25 minutes.

    Efficiently Computing Inclusion Dependencies for Schema Discovery

    Get PDF
    Large data integration projects must often cope with undocumented data sources. Schema discovery aims at automatically finding structures in such cases. An important class of relationships between attributes that can be detected automatically are inclusion dependencies (IND), which provide an excellent basis for guessing foreign key constraints. INDs can be discovered by comparing the sets of distinct values of pairs of attributes. In thi

    Efficiently detecting inclusion dependencies

    No full text
    Data sources for data integration often come with spurious schema definitions such as undefined foreign key constraints. Such metadata are important for querying the database and for database integration. We present our algorithm SPIDER (Single Pass Inclusion DEpendency Recognition) for detecting inclusion dependencies, as these are the automatically testable part of a foreign key constraint. For IND detection all pairs of attributes must be tested. SPIDER solves this task very efficiently by testing all attribute pairs in parallel. It analyzes a 2 GB database in ∼ 20 min and a 21 GB database in ∼ 4 h. 1. Schema Discovery for Data Integration In large integration projects one is often confronted with undocumented data sources. One important schema informatio

    Der GKV-Arzneimittelmarkt

    No full text
    Die vorliegende differenzierte Beschreibung des GKV-Arzneimittelmarktes gibt einen umfangreichen Einblick in das Verordnungsgeschehen und beleuchtet die Hinter-gründe der aktuellen Marktentwicklungen. Neben dem Geschehen im Gesamtmarkt werden die zentralen Marktsegmente der Patentarzneimittel, Biologika und Biosimilars sowie der Orphan Drugs differenziert dargestellt. Auch die Liefersicherheit von Arz-neimitteln, die Auswirkungen der Arzneimittelrabattverträge, die Zusammensetzung der Distributionskosten und die Marktdaten pharmazeutischer Hersteller werden be-handelt. Der Bericht wird ergänzt durch umfangreiches statistisches Material zum Arzneimittel-markt 2019, das auf unserer Webseite zum kostenfreien Download angeboten wird. Dieses umfasst unter anderem detaillierte Ergebnisse der Komponentenzerlegung des Umsatzes, mit deren Hilfe die Bewegungen im Arzneimittelmarkt im Jahr 2019 analy-siert werden können. Dazu kommen Übersichten über Arzneiverordnungen nach Fach-arztgruppen sowie nach Altersgruppen und Geschlecht der Versicherten, die einen dif-ferenzierten Einblick in das Verordnungsgeschehen des Jahres 2019 geben. Darüber hinaus werden die methodische Herangehensweise und die verschiedenen Klassifika-tionen erläutert

    Der GKV-Arzneimittelmarkt

    No full text
    Die vorliegende differenzierte Beschreibung des GKV-Arzneimittelmarktes gibt einen umfangreichen Einblick in das Verordnungsgeschehen und beleuchtet die Hinter-gründe der aktuellen Marktentwicklungen. Neben dem Geschehen im Gesamtmarkt werden die zentralen Marktsegmente der Patentarzneimittel, Biologika und Biosimilars sowie der Orphan Drugs differenziert dargestellt. Auch die Liefersicherheit von Arz-neimitteln, die Auswirkungen der Arzneimittelrabattverträge, die Zusammensetzung der Distributionskosten und die Marktdaten pharmazeutischer Hersteller werden be-handelt. Der Bericht wird ergänzt durch umfangreiches statistisches Material zum Arzneimittel-markt 2019, das auf unserer Webseite zum kostenfreien Download angeboten wird. Dieses umfasst unter anderem detaillierte Ergebnisse der Komponentenzerlegung des Umsatzes, mit deren Hilfe die Bewegungen im Arzneimittelmarkt im Jahr 2019 analy-siert werden können. Dazu kommen Übersichten über Arzneiverordnungen nach Fach-arztgruppen sowie nach Altersgruppen und Geschlecht der Versicherten, die einen dif-ferenzierten Einblick in das Verordnungsgeschehen des Jahres 2019 geben. Darüber hinaus werden die methodische Herangehensweise und die verschiedenen Klassifika-tionen erläutert
    corecore