Search CORE

147 research outputs found

Fusion de données redondantes : une approche explicative

Author: Saïs Fatiha
Thomopoulos Rallou
Publication venue: Hermann Editions
Publication date: 20/01/2016
Field of study

National audienceNous nous intéressons, dans le cadre du projet ANR Qualinca au trai-tement des données redondantes. Nous supposons dans cet article que cette re-dondance a déjà été établie par une étape préalable de liage de données. La question abordée est la suivante : comment proposer une représentation unique en fusionnant les "duplicats" identifiés ? Plus spécifiquement, comment décider, pour chaque propriété de la donnée considérée, quelle valeur choisir parmi celles figurant dans les "duplicats" à fusionner ? Quelle méthode adopter dans le but de pouvoir, par la suite, retracer et expliquer le résultat obtenu de façon trans-parente et compréhensible par l'utilisateur ? Nous nous appuyons pour cela sur une approche de décision multicritère et d'argumentation

HAL-CentraleSupelec

INRIA a CCSD electronic archive server

HAL-CIRAD

HAL-Rennes 1

Classification rule learning for data linking

Author: Fatiha Saïs
Nathalie Pernelle
Publication venue
Publication date
Field of study

Many approaches have been defined to link data items automatically. Nevertheless, when data are numerous and when the schema is unknown, most of these approaches are too time-consuming. We propose an approach where classification rules are learnt thanks to a training set made of linked data. These classification rules can then be applied in order to classify data items and reduce the linking space i.e the space made of data item pairs that have to be compared. First experiments have been conducted on RDF data sets describing electronic products

CiteSeerX

LDM: Link Discovery Method for new Resource Integration

Author: Pernelle Nathalie
Saïs Fatiha
Publication venue: HAL CCSD
Publication date: 29/05/2011
Field of study

International audienceIn this paper we address the problem of resource discovery in the Linked Open Data cloud (LOD) where data described by different schemas is not always linked. We propose an approach that allows discovery of new links between data. These links can help to match schemas that are conceptually relevant with respect to a given application domain. Furthermore, these links can be exploited during the querying process in order to combine data coming from different sources. In this approach we exploit the semantic knowledge declared in different schemas in order to model: (i) the inﬂuences between concept similarities, (ii) the inﬂuences between data similarities, and (iii) the inﬂuences between data and concept similarities. The similarity scores are computed by an iterative resolution of two non linear equation systems that express the concept similarity computation and the data similarity computation. The proposed approach is illustrated on scientiﬁc publication data.Dans ce papier nous nous intéressons au problème de découverte de resource dans le LOD (Linked Open Data), dans lequel les données décrites conformément à différents schémas ne sont pas toujours liées. Les liens sémantiques entre données peuvent aider à la recherche de correspondances entre schémas. De plus ces liens peuvent être exploités au moment des requêtes pour combiner des données décrites dans différentes sources. Dans cette approche, nous exploitons la sémantique des schémas de façon à modéliser : (1) les influences entre similarités de concept, (2) les influences entre similarités de données. Les scores de similarité sont calculés en résolvant itérativement deux systèmes d'équations représentant le calcul des similarités conceptuelles et le calcul des similarités entre données. L'approche est illustrée en utilisant le domaine des publications scientifiques

INRIA a CCSD electronic archive server

RDF data evolution: efficient detection and semantic representation of changes

Author: Daniel Mercier
Fatiha Saïs
Nathalie Pernelle
Sujeeban Thuraisamy
Publication venue
Publication date: 31/03/2020
Field of study

ABSTRACT Many RDF data sources are constantly changing for both data and vocabulary (ontology) levels. Many integration tasks are impacted by these changes. In this context, it is important to develop approaches to detect and represent these changes. Many studies have focused on the detection, the representation and the management of changes at the ontology level. In this paper, we present an approach which allows to detect and represent elementary and complex changes that can be detected when we focus only on the data level. A first experiment was conducted on different versions of DBpedia

CiteSeerX

33es Journées francophones d'Ingénierie des Connaissances

Author: Saïs Fatiha
Publication venue: HAL CCSD
Publication date: 29/06/2022
Field of study

National audienceLes journées francophones d'Ingénierie des Connaissances (IC) sont organisées chaque année depuis 1997, d'abord sous l'égide du Gracq (Groupe de Recherche en Acquisition des Connaissances) puis sous celle du collège SIC (Science de l'Ingénierie des Connaissances) de l'AFIA. Cette année encore, IC est hébergée par la plateforme PFIA, conjointement avec d'autres conférences francophones dans le domaine de l'intelligence artificielle (IA). L'ingénierie des connaissances peut être vue comme la thématique de l'Intelligence Artificielle accompagnant l'évolution des sciences et technologies de l'information et de la communication qui engendrent des mutations dans les pratiques individuelles et collectives. Elle ambitionne de contribuer à son essor en développant les modèles, les méthodes et les outils pour l'acquisition, la représentation et l'intégration de connaissances afin de rendre possible leur exploitation dans des environnements informatiques aux caractéristiques variées. La représentation formelle de ces connaissances permet des raisonnements automatiques sur ces connaissances et sur les données qui leur sont associées, pouvant être complexes, hétérogènes et évolutives. Sa finalité est la production de systèmes « intelligents et explicables », capables d'aider l'humain dans ses activités et pour la prise de décisions.La conférence IC est un lieu d'échanges et de réflexions, de présentation et de confrontation des théories, pratiques, méthodes et outils autour de l'ingénierie des connaissances. Cette communauté prend désormais en compte l'essor des algorithmes d'apprentissage automatique et leurs retombées sur les pratiques individuelles et collectives, tout en conservant l'humain au centre des systèmes de décision exploitant les données et les connaissances. Pour cette édition 2022 de la conférence, nous avons l'honneur de recevoir Prof. Christian Bizer - Chair of Information Systems V: Web-based Systems, Director of the Institute of Computer Science and Business Informatics, Allemagne, dont la conférence invitée est intitulée « Integrating Product Data from the Semantic Web using Deep Learning Techniques

HAL-CentraleSupelec

Dissimilarity-based approach for Identity Link Invalidation

Author: Saïs Fatiha
Publication venue: HAL CCSD
Publication date: 10/09/2020
Field of study

International audienceMore and more datasets are currently connected by identity links using properties such as owl:sameAs expressed in OWL. Identity links are statements that declare that two resources refer to the same real-world entity. However, we cannot attest the correctness of all identity links. Without a central name authority, most of identity links are generated by heuristics and they are not reviewed by experts. The main issue in invalidating identity links is the heterogeneity of datasets, they commonly do not share the same predicates and the description of resources can be incomplete. Despite how the resources are described, identity links are necessary to link data and posterior reuse. In this paper, we present here a framework to invalidate identity links by dissimilarity and outlier detection in equivalence classes of identity links

HAL-CentraleSupelec