15 research outputs found

    Identification des concepts pour la ré-ingénierie des ontologies

    Get PDF
    Des services Ă©lĂ©mentaires tels que la restructuration (Ang. refactoring), la fusion (Ang.merge), l’extraction de modules (Ang. modularization), etc., sont indispensables pour la mise en oeuvre d’une plateforme de gĂ©nie ontologique dont l’un des objectifs essentiels est d’assurer la qualitĂ© d’une ontologie qui risque de se dĂ©tĂ©riorer avec l’usage. INUKHUK est une plateforme de rĂ©-ingĂ©nierie d’ontologies dont les services ci-haut sont basĂ©s sur un cadre formel, dit Analyse Relationnelle de Concepts (ARC). L’ARC a le pouvoir de crĂ©er de nouvelles abstractions sur n’importe quel type d’élĂ©ments ontologiques (concept, propriĂ©tĂ©, etc.). Ces abstractions factorisent des descriptions communes Ă  plusieurs Ă©lĂ©ments et peuvent servir Ă  corriger et/ou enrichir l’ontologie de façon Ă  augmenter sa qualitĂ©. Toutefois, ces abstractions, qui sont le fruit d’un calcul mathĂ©matique, sont dĂ©pourvues de toute sĂ©mantique et par consĂ©quent nĂ©cessitent un effort de conceptualisation afin d’ĂȘtre justifiĂ©es et intĂ©grĂ©es Ă  une ontologie. Le but de ce travail est de fouiller le bien fondĂ© d’une abstraction et par la suite l’annoter avec un nom (En Anglais label) de concept. Les retombĂ©es sont multiples. D’abord, l’ontologie restructurĂ©e est beaucoup plus comprĂ©hensible par les experts et utilisateurs car l’enrichissement est autant structurel que sĂ©mantique. Ensuite, l’application des mĂ©triques de qualitĂ© basĂ©es sur l’analyse du vocabulaire ontologique pour l’estimation de la qualitĂ© de l’ontologie restructurĂ©e (Ang., refactored) est tout Ă  fait justifiable. Pour ce faire, plusieurs mĂ©thodes de fouille ont Ă©tĂ© envisagĂ©es. La premiĂšre mĂ©thode consiste Ă  l’identification d’un nouveau concept ontologique Ă  partir de la description de l’abstraction gĂ©nĂ©rĂ©e par l’ARC. La deuxiĂšme mĂ©thode consiste Ă  confronter l’abstraction gĂ©nĂ©rĂ©e par l’ARC Ă  des ressources linguistiques et/ou ontologiques existantes telles que WORDNET, structure catĂ©gorique de WIKIPEDIA, DBPEDIA, etc. Les deux approches ci-haut ont Ă©tĂ© implĂ©mentĂ©es au sein d’un outil, dit TOPICMINER, qui fait dĂ©sormais partie de la plateforme INUKHUK. TOPICMINER a fait l’objet de plusieurs expĂ©rimentations et a retournĂ© des rĂ©sultats satisfaisants selon le protocole de validation mis en place

    Structuration de données par apprentissage non-supervisé : applications aux données textuelles

    Get PDF
    En fouille de donnĂ©es, le succĂšs d'une mĂ©thode tient au fait qu'elle permet de rĂ©pondre par un algorithme intuitif Ă  un besoin pratique bien thĂ©orisĂ©. C'est avec cet Ă©clairage que nous prĂ©sentons un ensemble de contributions, Ă©laborĂ©es durant ces dix derniĂšres annĂ©es, et rĂ©pondant au besoin pratique de structurer automatiquement un ensemble de donnĂ©es. Dans un premier temps nous proposons de nouveaux modĂšles thĂ©oriques de structuration complexe en classes d’individus ; il s’agit alors d'extraire automatiquement d'un ensemble de donnĂ©es, des structures de classification plus proches de leur organisation rĂ©elle telle qu’observĂ©e (classification recouvrante, formes symĂ©triques), de rendre ces structures Ă  la fois robustes (tolĂ©rance au bruit) et manipulables par l’homme (visualisation, paramĂ©trage) et enfin d’ĂȘtre en mesure de les expliquer (sĂ©mantique des classes). Dans un second temps nous nous intĂ©ressons aux donnĂ©es textuelles via la mise en oeuvre de modĂšles rendant compte de la structure thĂ©matique d’une collection de textes courts dans un contexte de recherche d’information ; enfin, nous prĂ©sentons un mĂ©ta-modĂšle permettant d’apprendre automatiquement un modĂšle de structuration sĂ©mantique d’un ensemble de termes

    Architecture question-réponse pour l'automatisation des services d'information

    Full text link
    ThÚse numérisée par la Direction des bibliothÚques de l'Université de Montréal

    Fouille de données de santé

    Get PDF
    Dans le domaine de la santĂ©, les techniques d’analyse de donnĂ©es sont de plus en plus populaires et se rĂ©vĂšlent mĂȘme indispensables pour gĂ©rer les gros volumes de donnĂ©es produits pour un patient et par le patient. Deux thĂ©matiques seront abordĂ©es dans cette prĂ©sentation d'HDR.La premiĂšre porte sur la dĂ©finition, la formalisation, l’implĂ©mentation et la validation de mĂ©thodes d’analyse permettant de dĂ©crire le contenu de bases de donnĂ©es mĂ©dicales. Je me suis particuliĂšrement intĂ©ressĂ©e aux donnĂ©es sĂ©quentielles. J’ai fait Ă©voluer la classique notion de motif sĂ©quentiel pour y intĂ©grer des composantes contextuelles, spatiales et sur l’ordre partiel des Ă©lĂ©ments composant les motifs. Ces nouvelles informations enrichissent la sĂ©mantique initiale de ces motifs.La seconde thĂ©matique se focalise sur l’analyse des productions et des interactions des patients au travers des mĂ©dias sociaux. J’ai principalement travaillĂ© sur des mĂ©thodes permettant d’analyser les productions narratives des patients selon leurs temporalitĂ©s, leurs thĂ©matiques, les sentiments associĂ©s ou encore le rĂŽle et la rĂ©putation du locuteur s’étant exprimĂ© dans les messages

    ScaleSem (model checking et web sémantique)

    Get PDF
    Le dĂ©veloppement croissant des rĂ©seaux et en particulier l'Internet a considĂ©rablement dĂ©veloppĂ© l'Ă©cart entre les systĂšmes d'information hĂ©tĂ©rogĂšnes. En faisant une analyse sur les Ă©tudes de l'interopĂ©rabilitĂ© des systĂšmes d'information hĂ©tĂ©rogĂšnes, nous dĂ©couvrons que tous les travaux dans ce domaine tendent Ă  la rĂ©solution des problĂšmes de l'hĂ©tĂ©rogĂ©nĂ©itĂ© sĂ©mantique. Le W3C (World Wide Web Consortium) propose des normes pour reprĂ©senter la sĂ©mantique par l'ontologie. L'ontologie est en train de devenir un support incontournable pour l'interopĂ©rabilitĂ© des systĂšmes d'information et en particulier dans la sĂ©mantique. La structure de l'ontologie est une combinaison de concepts, propriĂ©tĂ©s et relations. Cette combinaison est aussi appelĂ©e un graphe sĂ©mantique. Plusieurs langages ont Ă©tĂ© dĂ©veloppĂ©s dans le cadre du Web sĂ©mantique et la plupart de ces langages utilisent la syntaxe XML (eXtensible Meta Language). Les langages OWL (Ontology Web Language) et RDF (Resource Description Framework) sont les langages les plus importants du web sĂ©mantique, ils sont basĂ©s sur XML.Le RDF est la premiĂšre norme du W3C pour l'enrichissement des ressources sur le Web avec des descriptions dĂ©taillĂ©es et il augmente la facilitĂ© de traitement automatique des ressources Web. Les descriptions peuvent ĂȘtre des caractĂ©ristiques des ressources, telles que l'auteur ou le contenu d'un site web. Ces descriptions sont des mĂ©tadonnĂ©es. Enrichir le Web avec des mĂ©tadonnĂ©es permet le dĂ©veloppement de ce qu'on appelle le Web SĂ©mantique. Le RDF est aussi utilisĂ© pour reprĂ©senter les graphes sĂ©mantiques correspondant Ă  une modĂ©lisation des connaissances spĂ©cifiques. Les fichiers RDF sont gĂ©nĂ©ralement stockĂ©s dans une base de donnĂ©es relationnelle et manipulĂ©s en utilisant le langage SQL ou les langages dĂ©rivĂ©s comme SPARQL. Malheureusement, cette solution, bien adaptĂ©e pour les petits graphes RDF n'est pas bien adaptĂ©e pour les grands graphes RDF. Ces graphes Ă©voluent rapidement et leur adaptation au changement peut faire apparaĂźtre des incohĂ©rences. Conduire l application des changements tout en maintenant la cohĂ©rence des graphes sĂ©mantiques est une tĂąche cruciale et coĂ»teuse en termes de temps et de complexitĂ©. Un processus automatisĂ© est donc essentiel. Pour ces graphes RDF de grande taille, nous suggĂ©rons une nouvelle façon en utilisant la vĂ©rification formelle Le Model checking .Le Model checking est une technique de vĂ©rification qui explore tous les Ă©tats possibles du systĂšme. De cette maniĂšre, on peut montrer qu un modĂšle d un systĂšme donnĂ© satisfait une propriĂ©tĂ© donnĂ©e. Cette thĂšse apporte une nouvelle mĂ©thode de vĂ©rification et d interrogation de graphes sĂ©mantiques. Nous proposons une approche nommĂ© ScaleSem qui consiste Ă  transformer les graphes sĂ©mantiques en graphes comprĂ©hensibles par le model checker (l outil de vĂ©rification de la mĂ©thode Model checking). Il est nĂ©cessaire d avoir des outils logiciels permettant de rĂ©aliser la traduction d un graphe dĂ©crit dans un formalisme vers le mĂȘme graphe (ou une adaptation) dĂ©crit dans un autre formalismeThe increasing development of networks and especially the Internet has greatly expanded the gap between heterogeneous information systems. In a review of studies of interoperability of heterogeneous information systems, we find that all the work in this area tends to be in solving the problems of semantic heterogeneity. The W3C (World Wide Web Consortium) standards proposed to represent the semantic ontology. Ontology is becoming an indispensable support for interoperability of information systems, and in particular the semantics. The structure of the ontology is a combination of concepts, properties and relations. This combination is also called a semantic graph. Several languages have been developed in the context of the Semantic Web. Most of these languages use syntax XML (eXtensible Meta Language). The OWL (Ontology Web Language) and RDF (Resource Description Framework) are the most important languages of the Semantic Web, and are based on XML.RDF is the first W3C standard for enriching resources on the Web with detailed descriptions, and increases the facility of automatic processing of Web resources. Descriptions may be characteristics of resources, such as the author or the content of a website. These descriptions are metadata. Enriching the Web with metadata allows the development of the so-called Semantic Web. RDF is used to represent semantic graphs corresponding to a specific knowledge modeling. RDF files are typically stored in a relational database and manipulated using SQL, or derived languages such as SPARQL. This solution is well suited for small RDF graphs, but is unfortunately not well suited for large RDF graphs. These graphs are rapidly evolving, and adapting them to change may reveal inconsistencies. Driving the implementation of changes while maintaining the consistency of a semantic graph is a crucial task, and costly in terms of time and complexity. An automated process is essential. For these large RDF graphs, we propose a new way using formal verification entitled "Model Checking".Model Checking is a verification technique that explores all possible states of the system. In this way, we can show that a model of a given system satisfies a given property. This thesis provides a new method for checking and querying semantic graphs. We propose an approach called ScaleSem which transforms semantic graphs into graphs understood by the Model Checker (The verification Tool of the Model Checking method). It is necessary to have software tools to perform the translation of a graph described in a certain formalism into the same graph (or adaptation) described in another formalismDIJON-BU Doc.Ă©lectronique (212319901) / SudocSudocFranceF

    JFPC 2019 - Actes des 15es Journées Francophones de Programmation par Contraintes

    Get PDF
    National audienceLes JFPC (JournĂ©es Francophones de Programmation par Contraintes) sont le principal congrĂšs de la communautĂ© francophone travaillant sur les problĂšmes de satisfaction de contraintes (CSP), le problĂšme de la satisfiabilitĂ© d'une formule logique propositionnelle (SAT) et/ou la programmation logique avec contraintes (CLP). La communautĂ© de programmation par contraintes entretient Ă©galement des liens avec la recherche opĂ©rationnelle (RO), l'analyse par intervalles et diffĂ©rents domaines de l'intelligence artificielle.L'efficacitĂ© des mĂ©thodes de rĂ©solution et l'extension des modĂšles permettent Ă  la programmation par contraintes de s'attaquer Ă  des applications nombreuses et variĂ©es comme la logistique, l'ordonnancement de tĂąches, la conception d'emplois du temps, la conception en robotique, l'Ă©tude du gĂ©nĂŽme en bio-informatique, l'optimisation de pratiques agricoles, etc.Les JFPC se veulent un lieu convivial de rencontres, de discussions et d'Ă©changes pour la communautĂ© francophone, en particulier entre doctorants, chercheurs confirmĂ©s et industriels. L'importance des JFPC est reflĂ©tĂ©e par la part considĂ©rable (environ un tiers) de la communautĂ© francophone dans la recherche mondiale dans ce domaine.PatronnĂ©es par l'AFPC (Association Française pour la Programmation par Contraintes), les JFPC 2019 ont lieu du 12 au 14 Juin 2019 Ă  l'IMT Mines Albi et sont organisĂ©es par Xavier Lorca (prĂ©sident du comitĂ© scientifique) et par Élise Vareilles (prĂ©sidente du comitĂ© d'organisation)
    corecore