55 research outputs found
Learning Commonalities in SPARQL
International audienceFinding the commonalities between descriptions of data or knowledge is a foundational reasoning problem of Machine Learning. It was formalized in the early 70's as computing a least general generalization (lgg) of such descriptions. We revisit this well-established problem in the SPARQL query language for RDF graphs. In particular, and by contrast to the literature, we address it for the entire class of conjunc-tive SPARQL queries, a.k.a. Basic Graph Pattern Queries (BGPQs), and crucially, when background knowledge is available as RDF Schema ontological constraints, we take advantage of it to devise much more precise lggs, as our experiments on the popular DBpedia dataset show
Learning Commonalities in RDF and SPARQL
Finding commonalities between descriptions of data or knowledge is a fundamental task in Machine Learning. The formal notion characterizing precisely such commonalities is known as least general generalization of descriptions and was introduced by G. Plotkin in the early 70's, in First Order Logic. Identifying least general generalizations has a large scope of database applications ranging from query optimization (e.g., to share commonalities between queries in view selection or multi-query optimization) to recommendation in social networks (e.g., to establish connections between users based on their commonalities between profiles or searches). To the best of our knowledge, this is the first work that re-visits the notion of least general generalizations in the entire Resource Description Framework (RDF) and popular con-junctive fragment of SPARQL, a.k.a. Basic Graph Pattern (BGP) queries. Our contributions include the definition and the computation of least general generalizations in these two settings, which amounts to finding the largest set of com-monalities between incomplete databases and conjunctive queries, under deductive constraints. We also provide an experimental assessment of our technical contributions
Ontology-Mediated Query Answering: Performance Challenges and Advances
International audienceOntology-mediated query answering (OMQA) is a recent data management trend in the Artificial Intelligence, Database and Semantic Web areas, which aims at answering database queries on knowledge bases. Because it is an intricate combination of automated reasoning and database query evaluation, it raises major performance challenges. In this demonstration, we showcase a decade of OMQA optimization to understand "Where do we stand now and how did we get there?" and we highlight a promising new OMQA optimization that brings further significant performance improvement to discuss "What's next?"
Réécriture de requêtes en termes de vues en présence de contraintes de valeurs pour un système d'intégration de sources de données agricoles
This thesis addresses the problem of query rewriting using views in the presence of value constraints. Value constraints allow for restricting value domain of a given attribute. They have been receiving a lot of attention because of their usefulness in the ontology web language OWL and in practical applications This work is motivated by a real application that aims at providing a scalable and exible integration system for agricultural data sources. The investigation of this problem is based on the description logics framework that allows for studying the problem decidability. This work provides also a mapping between the problem of computing rewritings due to the presence of value constraints and the framework of Knowledge Discovery in Database (KDD) introduced by Mannila and Toivonen. That enables us to reuse existing and ef cient algorithms to effectively compute rewritings and propose a scalable prototype of rewriting.Cette thèse traite le problème de la réécriture de requêtes en termes de vues en présence de contraintes de valeurs. Les contraintes de valeurs permettent de restreindre le domaine de valeur d'un attribut donné. Elles connaissent un regain d'intérêt depuis leur utilisation dans le cadre du langage d'ontologie du web OWL. Ce travail est motivé par une application réelle qui vise à permettre l'intégration flexible d'un grand nombre de sources de données agricoles. L'étude de la décidabilité de ce problème est basée sur le cadre des logiques de description. Ce travail montre également que le problème de calculer les réécritures engendrées par les contraintes de valeurs se rattache au cadre de découverte des connaissances dans les bases de données introduit par Mannila and Toivonen. Ceci nous permet d'adpter des algorithmes exustants et efficaces pour calculer ces réécritures et proposer un prototype de réécriture qui passe à l'echelle
Répondre à une requête floue en termes de vues imprécises
National audienc
Techniques de fouille de données pour la rééecriture de requêtes en présence de contraintes de valeurs
National audienceThis paper addresses the problem of query rewriting using views in presence of value constraints. These constraints restrict the values of a given attribute. To solve this problem we follow an hybrid approach that uses (i) the setting of the description logics to study the theoritical properties of the problem and, (ii) data mining techniques to get scalable algorithmic solutions that help solving our rewriting problem. This work is motivated by a real application that aims at providing a scalable integration system for querying agricultural data sources.Cet article traite du problème de la réécriture de requêtes en termes de vues en présence de contraintes de valeurs. Ces contraintes spécifient l'ensemble des valeurs permises pour un attribut donné. Pour résoudre ce problème, nous proposons une approche hybride qui utilise (i) le cadre formel des logiques de description pour étudier les propriétés théoriques du problème et (ii) les techniques de fouilles de données pour fournir des solutions algorithmiques efficaces en pratique pour calculer les réécritures engendrées par les contraintes de valeurs. Ce travail se situe dans le cadre d'un projet visant à mettre en place un système d'intégration pour des sources de données agricoles hétérogènes et distribuées
Techniques de fouille de données pour la réécriture de requêtes en présence de contraintes de valeurs
National audienc
Réécriture de requêtes en termes de vues en présence de contraintes de valeurs pour un système d'intégration de sources de données agricoles
Cette thèse traite le problème de la réécriture de requêtes en termes de vues en présence de contraintes de valeurs. Les contraintes de valeurs permettent de restreindre le domaine de valeur d'un attribut donné. Elles connaissent un regain d'intérêt depuis leur utilisation dans le cadre du langage d'ontologie du web OWL. Ce travail est motivé par une application réelle qui vise à permettre l'intégration flexible d'un grand nombre de sources de données agricoles. L'étude de la décidabilité de ce problème est basée sur le cadre des logiques de description. Ce travail montre également que le problème de calculer les réécritures engendrées par les contraintes de valeurs se rattache au cadre de découverte des connaissances dans les bases de données introduit par Mannila and Toivonen. Ceci nous permet d'adapter des algorithmes existants et efficaces pour calculer ces réécritures et proposer un prototype de réécriture qui passe à l'echelleCLERMONT FD-BCIU Sci.et Tech. (630142101) / SudocNANCY-INRIA Lorraine LORIA (545472304) / SudocSudocFranceF
Techniques de fouille de données pour la rééecriture de requêtes en présence de contraintes de valeurs
National audienceThis paper addresses the problem of query rewriting using views in presence of value constraints. These constraints restrict the values of a given attribute. To solve this problem we follow an hybrid approach that uses (i) the setting of the description logics to study the theoritical properties of the problem and, (ii) data mining techniques to get scalable algorithmic solutions that help solving our rewriting problem. This work is motivated by a real application that aims at providing a scalable integration system for querying agricultural data sources.Cet article traite du problème de la réécriture de requêtes en termes de vues en présence de contraintes de valeurs. Ces contraintes spécifient l'ensemble des valeurs permises pour un attribut donné. Pour résoudre ce problème, nous proposons une approche hybride qui utilise (i) le cadre formel des logiques de description pour étudier les propriétés théoriques du problème et (ii) les techniques de fouilles de données pour fournir des solutions algorithmiques efficaces en pratique pour calculer les réécritures engendrées par les contraintes de valeurs. Ce travail se situe dans le cadre d'un projet visant à mettre en place un système d'intégration pour des sources de données agricoles hétérogènes et distribuées
Parallel Processing Strategies for Skyline Queries Tolerant to Outliers
International audienc
- …