39 research outputs found

    Poster session: Constrained dynamic physical database design

    Get PDF
    Physical design has always been an important part of database administration. Today's commercial database management systems offer physical design tools, which recommend a physical design for a given workload. However, these tools work only with static workloads and ignore the fact that workloads, and physical designs, may change over time. Research has now begun to focus on dynamic physical design, which can account for time-varying workloads. In this paper, we consider a dynamic but constrained approach to physical design. The goal is to recommend dynamic physical designs that reflect major workload trends but that are not tailored too closely to the details of the input workloads. To achieve this, we constrain the number of changes that are permitted in the recommended design. In this paper we present our definition of the constrained dynamic physical design problem and discuss several techniques for solving it

    Grid collector: an event catalog with automated file management

    Full text link
    High Energy Nuclear Physics (HENP) experiments such as STAR at BNL and ATLAS at CERN produce large amounts of data that are stored as files on mass storage systems in computer centers. In these files, the basic unit of data is an event. Analysis is typically performed on a selected set of events. The files containing these events have to be located, copied from mass storage systems to disks before analysis, and removed when no longer needed. These file management tasks are tedious and time consuming. Typically, all events contained in the files are read into memory before a selection is made. Since the time to read the events dominate the overall execution time, reading the unwanted event needlessly increases the analysis time. The Grid Collector is a set of software modules that works together to address these two issues. It automates the file management tasks and provides ''direct'' access to the selected events for analyses. It is currently integrated with the STAR analysis framework. The users can select events based on tags, such as, ''production date between March 10 and 20, and the number of charged tracks > 100.'' The Grid Collector locates the files containing relevant events, transfers the files across the Grid if necessary, and delivers the events to the analysis code through the familiar iterators. There has been some research efforts to address the file management issues, the Grid Collector is unique in that it addresses the event access issue together with the file management issues. This makes it more useful to a large variety of users

    Ontological Matchmaking in Recommender Systems

    Full text link
    The electronic marketplace offers great potential for the recommendation of supplies. In the so called recommender systems, it is crucial to apply matchmaking strategies that faithfully satisfy the predicates specified in the demand, and take into account as much as possible the user preferences. We focus on real-life ontology-driven matchmaking scenarios and identify a number of challenges, being inspired by such scenarios. A key challenge is that of presenting the results to the users in an understandable and clear-cut fashion in order to facilitate the analysis of the results. Indeed, such scenarios evoke the opportunity to rank and group the results according to specific criteria. A further challenge consists of presenting the results to the user in an asynchronous fashion, i.e. the 'push' mode, along with the 'pull' mode, in which the user explicitly issues a query, and displays the results. Moreover, an important issue to consider in real-life cases is the possibility of submitting a query to multiple providers, and collecting the various results. We have designed and implemented an ontology-based matchmaking system that suitably addresses the above challenges. We have conducted a comprehensive experimental study, in order to investigate the usability of the system, the performance and the effectiveness of the matchmaking strategies with real ontological datasets.Comment: 28 pages, 8 figure

    Helppokäyttöisen OLAP -kyselykielen suunnittelu ja toteutus

    Get PDF
    Tässä tutkielmassa esitellään peruskäsitteistö OLAP (On-line Analytical Processing) -järjestelmälle ja tähän käsitteistöön perustuen luodaan perusoperaatiot moniulotteisesti organisoidun tietokuution käsittelemiseksi. Käsitteistössä erotetaan eksplisiittisesti kaavio- ja ilmentymätaso mahdollistamaan yleinen OLAP -kuution esittäminen ja siihen perustuvan kielen kehittäminen. Käyttäjäystävällisyys OLAP -kyselykieleen saadaan siten, että kieli sisältää vain kaksi korkealla abstraktiotasolla olevaa OLAP -operaatiota view ja add, joiden käyttäminen on tavalliselle loppukäyttäjälle sekä intuitiivista että deklaratiivista. Näillä operaatioilla on poikkeuksellisen suuri ilmaisuvoima. Esimerkiksi kehitetyllä view -operaatiolla on mahdollista ilmaista mikä tahansa perinteisten OLAP -järjestelmien operaatioiden kombinaatio. Täten kehitetty view -operaatio on huomattavasti korkeammalla abstraktiotasolla kuin nykyisten OLAP -kyselykielien operaatiot. Tätä piirrettä demonstroidaan tutkielmassa useiden esimerkkikyselyjen yhteydessä. Kehitettyjen operaatioiden lisäksi kieli koostuu logiikkaohjelmoinnin perusilmauksista, joita käytetään järjestelmän relationaalisesti organisoidun tiedon käsittelyyn. Kieli sisältää myös ilmaisun, jolla relationaalinen käsittely ja OLAP -käsittely integroidaan. Tekstuaalisen kyselykielen lisäksi tutkielmassa kehitetään myös graafinen kyselykieli, jonka ilmaisuvoima ei ole vielä samalla tasolla kuin tekstuaalisen kyselykielen. Kielen sisältämät operaatiot toteutettiin LPA:n Win-Prologilla. Logiikkaohjelmoinnin perusilmausten deklaratiivisuus sekä jaetun muuttujan käsite suovat mahdollisuuden esittää mutkikkaitakin OLAP -kyselyjä tiiviisti ja käyttäjäystävällisesti1. Johdanto 1 1.1. Ilmiö 1 1.2. OLAP:n vaatimukset 2 1.2.1. Nopeus 2 1.2.2. Ilmaisuvoima 3 1.2.3. Joustavuus 3 1.3. Taulukkolaskennan ja SQL:n puutteet 4 1.3.1. Taulukkolaskenta ja OLAP 4 1.3.2. SQL ja OLAP 4 1.4. Lähestymistavat 8 1.4.1. ROLAP (Relational OLAP) 8 1.4.2. MOLAP (Multidimensional OLAP) 8 1.4.3. HOLAP (Hybrid OLAP) 9 1.5. OLAP ja tietovarastot 9 1.6. Tutkielman organisointi 10 2. MOLAP -tietokuution organisointi 11 2.1. Muuttujat 11 2.2. Tiedon tyypit 13 2.3. Taulut 13 2.4. Muuttujien päivityksestä 15 2.5. Solut 16 2.6. Kaavat 17 3. OLAP-kuutioiden esittäminen konstruktori -orientoituneesti logiikkaohjelmoinnissa 18 3.1. Konstruktorit 18 3.1.1. Järjestetty joukko 18 3.1.2. Järjestämätön joukko 18 3.2. Rakennettavan MOLAP-kuution Peruslähtökohdat 19 3.3. OLAP -kuution logiikkapohjainen esittäminen 19 3.3.1. MOLAP -taulujen esittäminen logiikkaohjelmointiperustaisesti 20 3.3.2. Ominaisuustaulut 21 3.3.3. Aputietotaulut 23 4. Esimerkkijärjestelmä 25 4.1. MOLAP -taulut 25 4.2. Ominaisuustaulut 27 4.3. Karkeistushierarkiat 29 5. Näkymät 32 5.1. View -operaatio 32 5.2. OLAP:n perusoperaatiot 34 5.2.1. Projektio 34 5.2.2. Konkatenaatio 36 5.2.3. Porautuminen 36 5.2.4. Pyöristäminen 38 5.2.5. Kääntäminen 38 6. Add -operaatio 40 7. Kyselyjen tekeminen kehitetyllä kyselykielellä 41 7.1. Useampi operaatio yhdessä view -operaatiossa 41 7.2. Ominaisuustaulujen yhdistäminen kyselyyn 44 7.3. Ketjutetut operaatiot 49 8. Graafinen käyttöliittymä 51 8.1. Graafisen käyttöliittymän näytöt 51 8.2. Kyselyjen tekeminen graafisellä käyttöliittymällä 53 8.3. Graafisen käyttöliittymän tekoäly 56 9. Yhteenveto 57 10. Lähteet 5

    Content warehouses

    Get PDF
    Nowadays, content management systems are an established technology. Based on the experiences from several application scenarios we discuss the points of contact between content management systems and other disciplines of information systems engineering like data warehouses, data mining, and data integration. We derive a system architecture called "content warehouse" that integrates these technologies and defines a more general and more sophisticated view on content management. As an example, a system for the collection, maintenance, and evaluation of biological content like survey data or multimedia resources is shown as a case study

    An efficient compression scheme for bitmap indices

    Full text link
    corecore