1 research outputs found

    Query Processing in Multistore Systems: an overview

    Get PDF
    Building cloud data-intensive applications often requires using multiple data stores (NoSQL, HDFS, RDBMS, etc.), each optimized for one kind of data and tasks. However, the wide diversification of data store interfaces makes it difficult to access and integrate data from multiple data stores. This important problem has motivated the design of a new generation of systems, called multistore systems, which provide integrated or transparent access to a number of cloud data stores through one or more query languages. In this paper, we give an overview of query processing in multistore systems. We start by introducing the recent cloud data management solutions and query processing in multidatabase systems. Then, we describe and analyze some representative multistore systems, based on their architecture, data model, query languages and query processing techniques. To ease comparison, we divide multistore systems based on the level of coupling with the underlying data stores, i.e. loosely-coupled, tightly-coupled and hybrid. Our analysis reveals some important trends, which we discuss. We also identify some major research issues.Le développement d'applications orientées-données dans le cloud exige souvent de pouvoir manipuler des data stores multiples et différents (NoSQL, HDFS, RDBMS, etc.), chacun optimisé pour un type de données et de traitements. Cependant la grande diversification des interfaces de ces data stores rend difficile l'accès et l'intégration de données depuis plusieurs data stores. Ce problème important a conduit à la conception d'une nouvelle génération de systèmes, les systèmes multistores, qui fournissent l'accès intègre et transparent à des data stores dans le cloud avec un ou plusieurs langages de requêtes. Dans ce rapport, nous proposons un survol du traitement de requêtes dans les systèmes multistores. Nous commençons par introduire les récentes solutions de gestion de données dans le cloud et le traitement de requêtes dans les systèmes multibases de données. Puis, nous décrivons et analysons un ensemble représentatif de systèmes multistores, selon leur architecture, modèle de données, langage de requêtes et techniques de traitement de requêtes. Pour faciliter la comparaison, nous classons les systèmes multistores en fonction du niveau de couplage avec les data stores: faiblement couplé, fortement couplé, et hybride. Nos comparaisons révèlent des tendances importantes, que nous discutons. Nous terminons en identifiant des directions de recherche majeure
    corecore