Search CORE

95 research outputs found

Auto-administration des entrepôts de données complexes

Author: Aouiche Kamel
Bentayeb Fadila
Boussaïd Omar
Darmont Jérôme
Publication venue: Hermann
Publication date: 01/09/2005
Field of study

National audienceLes requêtes définies sur les entrepôts de données sont souvent compliquées et utilisent plusieurs opérations de jointure qui sont coûteuses en terme de temps de calcul. Dans le cadre de l'entreposage de données complexes, les adaptations apportées aux schémas classiques d'entrepôts induisent des jointures supplémentaires lors des accès aux données. Ce coût devient encore plus important quand les requêtes opèrent sur de très grands volumes de données. Il est donc primordial de réduire ce temps de calcul. Pour cela, les administrateurs d'entrepôts de données utilisent en général des techniques d'indexation comme les index de jointure en étoile ou les index \textit{bitmap} de jointure. Cela demeure néanmoins complexe et fastidieux. La solution que nous proposons s'inscrit dans une optique d'auto-administration des entrepôts de données. Dans ce cadre, nous proposons une stratégie de sélection automatique d'index. Pour cela, nous avons recouru à une technique de fouille de données, plus particulièrement la recherche de motifs fréquents, pour déterminer un ensemble d'index candidats à partir d'une charge donnée. Nous proposons ensuite des modèles de coût permettant de sélectionner parmi les index ceux qui engendrent le meilleur profit. Ces modèles de coût évaluent en particulier le temps d'accès aux données à travers des index \textit{bitmap} de jointure, ainsi que le coût de maintenance et de stockage de ces index

HAL

Databases and Information Systems in the AI Era: Contributions from ADBIS, TPDL and EDA 2020 Workshops and Doctoral Consortium

Author: Bellatreche Ladjel
Bentayeb Fadila
Bieliková Mária
Boussaid Omar
Catania Barbara
Ceravolo Paolo
Demidova Elena
Gomez Lopez Maria Teresa
Halfeld Ferrari Mirian
Kordić Slavica
Luković Ivan
Manghi Paolo
Mannocci Andrea
Osborne Francesco
Papatheodorou Christos
Ristić Sonja
Romero Oscar
S. Hara Carmem
Sacharidis Dimitris
Salatino Angelo
Talens Guilaine
van Keulen Maurice
Vergoulis Thanasis
Zumer Maja
Publication venue: 'Springer Science and Business Media LLC'
Publication date: 01/01/2020
Field of study

Research on database and information technologies has been rapidly evolving over the last couple of years. This evolution was lead by three major forces: Big Data, AI and Connected World that open the door to innovative research directions and challenges, yet exploiting four main areas: (i) computational and storage resource modeling and organization; (ii) new programming models, (iii) processing power and (iv) new applications that emerge related to health, environment, education, Cultural Heritage, Banking, etc. The 24th East-European Conference on Advances in Databases and Information Systems (ADBIS 2020), the 24th International Conference on Theory and Practice of Digital Libraries (TPDL 2020) and the 16th Workshop on Business Intelligence and Big Data (EDA 2020), held during August 25–27, 2020, at Lyon, France, and associated satellite events aimed at covering some emerging issues related to database and information system research in these areas. The aim of this paper is to present such events, their motivations, and topics of interest, as well as briefly outline the papers selected for presentations. The selected papers will then be included in the remainder of this volume

Crossref

AIR Universita degli studi di Milano

Open Research Online (The Open University)

Archivio istituzionale della ricerca - Università di Genova

University of Twente Research Information

idUS. Depósito de Investigación Universidad de Sevilla

Entrepôts et analyse en ligne de données complexes centrés utilisateur : un nouveau défi

Author: Bentayeb Fadila
Publication venue: HAL CCSD
Publication date: 24/11/2011
Field of study

The main goal of data warehouses is to facilitate decision making. In order to satisfy the whole analysis needs of the majority of the users, a promising issue consists in integrating a personalization process for OLAP analysis by taking into account user's own knowledge, preferences, needs,... In other words, the objective is to provide a user-centric decision-making system. In this thesis, we aim at proposing novel solutions for user-centric data warehouses. First, we have designed an original approach to achieve a user-driven model evolution that provides answers to personalized analysis needs. Our key idea consists in generating new anlysis axes based on users' knowledge by dynamically extending dimension hierachies or creating new ones. Moreover, to help users to find non expected and pertinent aggregates expressing deep relations within a data warehouse, we propose to combine data mining techniques with OLAP. We have more precisely defined a new roll-up operator based on the K-means clustering method. In addition, we have proposed a framework for mining large databases without size limit in very acceptable processing times. For this end, we have integrated data mining techniques within database management systems (DBMSs) by exploiting only their features. This helps to facilitate the extension of the capabilities of OLAP towards explicative and predictive analysis. To take into account both data sources changes and users requirements evolution, we have designed a user-centric approach for producing OLAP data cubes on the fly. This is based on a mediation system using ontologies. To generate the global merged ontology from local ontologies, we use the agglomerative hierarchical clustering method. Int the other hand, to warehouse complex data, we have designed a complex object-based multidimensional model. This is defined at two layers: (1) the package diagram layer which describes complex objects and their complex relationships and (2) the class diagram layer which provides details about the structure of each complex object. From the complex object-based multidimensional model, personalized complex object cubes can be derived. Eventually, for evaluationg our user-centric data warehouses solutions, we have implemented and carried out some experiments in both the contexts of relational and XML data warehouses.Les entrepôts de données répondent à un réel besoin en matière d'accès à l'information résumée. Cependant, en suivant le processus classique d'entreposage et d'analyse en ligne (OLAP) de données, les systèmes d'information décisionnels (SID) exploitent très peu le contenu informationnel des données. Alors même que les SID sont censés être centrés utilisateur, l'OLAP classique ne dispose pas d'outils permettant de guider l'utilisateur vers les faits les plus intéressants du cube. La prise en compte de l'utilisateur dans les SID est une problématique nouvelle, connue sous le nom de personnalisation, qui pose plusieurs enjeux peu ou pas étudiés. Le travail présenté dans ce mémoire vise à proposer des solutions innovantes dans le domaine de la personnalisation dans les entrepôts de données complexes. L'originalité de nos travaux de recherche a consisté à montrer qu'il est pertinent d'intégrer la sémantique dans tout le processus d'entreposage, soit en invitant l'utilisateur à exprimer ses propres connaissances métier, soit en utilisant les méthodes de fouille de données pour extraire des connaissances cachées. En s'appuyant sur l'intuition que des connaissances sur le métier, sur les données entreposées et leur usage (requêtes) peuvent contribuer à aider l'utilisateur dans son exploration et sa navigation dans les données, nous avons proposé une première approche de personnalisation basée sur les connaissances explicites des utilisateurs. En empruntant le concept d'évolution de schéma, nous avons relâché la contrainte du schéma fixe de l'entrepôt, pour permettre d'ajouter ou de supprimer un niveau de hiérarchie dans une dimension. Ces travaux ont été étendus pour recommander à l'utilisateur des hiérarchies de dimension nouvelles basées sur la découverte de nouvelles structures naturelles grâce aux principes d'une méthode de classification (K-means). Nous avons par ailleurs développé la fouille en ligne en s'appuyant uniquement sur les outils offerts par les systèmes de gestion de bases de données (SGBD). La fouille en ligne permet d'étendre les capacités analytiques des SGBD, support des entrepôts de données, de l'OLAP vers une analyse structurante, explicative et prédictive ; et venir en appui à la personnalisation. Afin de prendre en compte à la fois l'évolution des données et celle des besoins tout en garantissant l'intégration structurelle et sémantique des données, nous avons proposé une approche d'analyse en ligne à la demande, qui s'appuie sur un système de médiation à base d'ontologies. Par ailleurs, nous avons proposé un modèle multidimensionnel d'objets complexes basé sur le paradigme objet qui permet de représenter les objets de l'univers de façon plus naturelle et de capter la sémantique qu'ils véhiculent. Un opérateur de projection cubique est alors proposé pour permettre à l'utilisateur de créer des cubes d'objets complexes personnalisés. Toutes nos solutions ont été développées et testées dans le contexte des entrepôts de données relationnels et/ou XML

Thèses en Ligne

Hal-Diderot