1,001 research outputs found

    Donner du sens à des documents semi-structurés : de la construction d'ontologies à l'annotation sémantique

    Get PDF
    Chapitre 05 : Donner du sens Ă  des documents semi-structurĂ©s : de la construction d'ontologies Ă  l'annotation sĂ©mantiqueNational audiencePartie 1 : construction et peuplement d'ontologies à partir de textes : démarche générale - critères de bonne structuration d'une ontologie - outils de Traitement Automatique des Langues pour faciliter la construction d'ontologies - ouvertures Partie 2 : "donner du sens" à des contenus : l'annotation sémantique : associer des données et des modèles sémantiques - démarche générale - quel type de ressource pour caractériser "sémantiquement" des contenus/ des données ? - où l'on retrouve le TAL / ouverture

    Construction semi-automatique d'une ontologie sur des manuscrits ouest sahariens

    Get PDF
    International audienceAs more efforts are performed to digitize Western Saharan manuscripts, for preserving the memory they represent, the need to be able to work on thesedigitized materials naturally grows. Beyond cataloguing, an ontology is the basis to provide to researchers new tools for retrieving and integrating these knowledge sources. In this paper, we present the design of OMOS, an ontology describing Western Saharan manuscripts. We illustrate each step, from expert interviews and local resources analysis to the alignment with well-established reference ontologies, including an automatic enrichment from existing thesaurus.Dans le cadre de la sauvegarde et de la valorisation des documents patrimoniaux, des campagnes de numérisation des manuscrits anciens ont été entreprises dans différents endroits notamment dans une partie de l'ouest africain. Ces campagnes de numérisation ont généré un nombre important des ressources numériques potentiellement riches en informations que les chercheurs en sciences humaines et sociales et le grand public désireraient exploiter. Dans cet article, nous proposons un moyen d'accÚs à toutes les informations sur les manuscrits qui soit plus riche que ceux disponibles dans les catalogues. Pour cela, nous avons construit de façon semi-automatique une ontologie regroupant les connaissances sur les manuscrits. Les différentes étapes suivies dans la construction de l'ontologie allant de l'acquisition des connaissances à partir d'un certain nombre de ressources jusqu'à son enrichissement semi-automatique à partir d'un thésaurus sont présentées. Nous avons par la suite procédé à son alignement avec certaines ontologies de référence

    Construction et enrichissement automatique d'ontologie Ă  partir de ressources externes

    Get PDF
    National audienceAutomatic construction of ontologies from text is generally based on retrieving text content. For a much more rich ontology we extend these approaches by taking into account the document structure and some external resources (like thesaurus of indexing terms of near domain). In this paper we describe how these external resources are at first analyzed and then exploited. This method has been applied on a geographical domain and the benefit has been evaluated

    Correction d'ontologies construites Ă  partir de la structure de documents

    Get PDF
    National audienceLes logiciels de construction d'ontologies Ă  partir de textes rĂ©alisent une interprĂ©tation fixĂ©e a priori du contenu des textes, qu'un expert du domaine ou une ontologie doit vĂ©rifier. Or une Ă©tude prĂ©cise des limites des techniques d'analyse des textes permet de guider la correction de l'ontologie apprise en dĂ©finissant des rĂšgles d'aide Ă  la correction. Ces rĂšgles attirent l'attention de l'ontographe sur des parties d'ontologie contenant des « anomalies » et tiennent compte du texte d'origine et de l'analyse rĂ©alisĂ©e pour proposer des corrections. Dans cet article, nous illustrons la notion de rĂšgle de correction dans le cas oĂč les connaissances apprises viennent de l'exploitation de structures Ă©numĂ©ratives parallĂšles prĂ©sentes en corpus

    Un systÚme data mining en ligne pour la maintenance ontologique d'une mémoire corporative DM

    Get PDF
    L'intĂ©gration de la connaissance dans la mĂ©moire corporative (RibiĂšre et Matta, 1998), (Dieng et al., 1998) fait face Ă  l'hĂ©tĂ©rogĂ©nĂ©itĂ© des donnĂ©es (Visser, Jones et al., 1997). L'utilisation de l'ontologie est une approche possible pour surmonter ce problĂšme. Cependant, l'ontologie est une structure de donnĂ©e comme n'importe quelle structure informatique, elle est donc dynamique et Ă©volue dans le temps Ă  cause des conditions dynamiques rĂ©sultant des changements du domaine conceptuel, les changements de conceptualisation, les changements de spĂ©cification, les changements descendants, etc. (Yildiz, 2006). Ces derniĂšres annĂ©es, plusieurs approches ont Ă©tĂ© proposĂ©es pour rĂ©soudre le problĂšme de la maintenance des ontologies. Cependant, la prĂ©cision et le rappel ne permettent pas de satisfaire les besoins des utilisateurs. De plus, ces approches ne prennent pas en compte toute l'information disponible pour prendre une dĂ©cision rĂ©aliste. Pour rĂ©soudre le problĂšme de l'Ă©volution de la connaissance dans les ontologies, nous proposons une approche hybride qui utilise l'apprentissage machine et un processus d'alignement qui contrĂŽle les relations syntaxiques entre les entrĂ©es dans l'ontologie. De plus, des rĂšgles structurelles et des heuristiques sont appliquĂ©es pour amĂ©liorer le degrĂ© de similitude entre les entitĂ©s ontologiques. Ce processus hybride crĂ©e des rĂšgles de correspondance qui dĂ©finissent comment transformer les entrĂ©es dans l'ontologie en dĂ©finissant tous les types d'associations possibles entre les entitĂ©s ontologiques. L'approche d'enrichissement de l'ontologie exploite les techniques de la fouille de donnĂ©es, les techniques du traitement automatique du langage naturel et la recherche d'information pour amĂ©liorer la performance d'apprentissage durant la tĂąche d'enrichissement du domaine conceptuel. L'Ă©valuation des ontologies demeure un problĂšme important et le choix d'une approche appropriĂ©e dĂ©pend des critĂšres utilisĂ©s. Dans notre approche, nous adoptons la vĂ©rification de la cohĂ©rence dĂ©crite dans (Maziar Amirhosseini et al., 2011) et (Abderrazak et al., 2011).\ud ______________________________________________________________________________ \ud MOTS-CLÉS DE L’AUTEUR : Data Mining, Traitement automatique du langage naturel, Apprentissage machine, Recherche d'information, IntĂ©gration, Ontologie, MĂ©moire corporative, Web sĂ©mantique

    " Quand rédiger c'est décrire " : Mise en forme matérielle des textes et construction d'ontologies à partir de textes

    Get PDF
    National audienceLa construction d'ontologie Ă  partir de textes met classiquement en oeuvre des outils issus du Traitement Automatique de la Langue et/ou des outils d'apprentissage supervisĂ© ou non. Dans cet article nous revenons sur la possibilitĂ© d'exploiter des objets textuels Ă  la fois facilement identifiables, souvent fertiles en connaissances ontologiques, et dont la sĂ©mantique peut clairement ĂȘtre explicitĂ©e par les thĂ©ories du discours : les structures Ă©numĂ©ratives. Ici, nous ajoutons une nouvelle classe de relations sĂ©mantiques portĂ©e par les structures Ă©numĂ©ratives trĂšs prĂ©sentes dans nos corpus : les relations lexicales telles que l'homonymie ou la synonymie. Ces relations semblent propices pour alimenter la facette terminologique d'une Ressource Termino-Ontologique. Nous montrons que ces relations peuvent ĂȘtre formellement caractĂ©risĂ©es. Une Ă©valuation de notre approche Ă  partir d'un corpus annotĂ© manuellement nous permet de valider notre position, ce qui constitue une premiĂšre Ă©tape vers un outil d'apprentissage supervisĂ© pour la construction d'ontologie Ă  partir de texte

    Trois méthodes d'analyse pour conceptualiser le contenu de différentes sections des monographies des médicaments

    No full text
    National audienceA partir de l'expérience issue de travaux de modélisation conceptuelle des connaissances contenues dans trois sections différentes des monographies des médicaments (indication, pharmacodynamie, pharmacocinétique), une analyse des méthodes de modélisation est proposée. Les différentes méthodes (pattern matching, modélisation ascendante et approche mixte) et les modalités de leur choix sont analysées en mettant en lumiÚre des différences de nature entre les textes et l'existence de connaissances sur le domaine. Ceci nous conduit à proposer plusieurs indicateurs descriptifs de la nature du texte qui nous semblent susceptibles d'aider au choix d'une des trois méthodes proposées. Nous proposons aussi plusieurs méthodologies d'évaluation des modÚles obtenus, elles aussi étant liées aux caractéristiques des textes initiaux

    Contribution Ă  la maintenance des ontologies Ă  partir d'analyses textuelles : extraction de termes et de relations entre termes

    Get PDF
    Les ontologies sont des nouvelles formes de contrĂŽle intelligent de l'information. Elles prĂ©sentent un savoir prĂ©alable requis pour un traitement systĂ©matique de l'information Ă  des fins de navigation, de rappel, de prĂ©cision, etc. Toutefois, les ontologies sont confrontĂ©es de façon continue Ă  un problĂšme d'Ă©volution. Étant donnĂ© la complexitĂ© des changements Ă  apporter, un processus de maintenance, du moins semi-automatique, s'impose de plus en plus pour faciliter cette tĂąche et assurer sa fiabilitĂ©.\ud L'approche proposĂ©e trouve son fondement dans un modĂšle cognitif dĂ©crivant un processus d'extraction de connaissances Ă  partir de textes et de thĂ©saurus. Nous mettons ainsi, les textes au centre du processus d'ingĂ©nierie des connaissances et prĂ©sentons une approche se dĂ©marquant des techniques formelles classiques en reprĂ©sentation de connaissances par son indĂ©pendance de la langue. Les traitements textuels sont fondĂ©s principalement sur un processus de classification supportĂ© par un rĂ©seau de neurones (ART 1) et sur l'Indexation SĂ©mantique Latente appliquĂ©e sur des classes de termes. Partant de l'hypothĂšse que l'extraction -de connaissances Ă  partir de textes ne peut se contenter d'un traitement statistique (ni mĂȘme linguistique) de donnĂ©es textuelles pour accaparer toute leur richesse sĂ©mantique, un processus d'extraction de connaissances Ă  partir d'un thĂ©saurus a Ă©tĂ© conçu afin d'intĂ©grer, le mieux possible, les connaissances du domaine au sein de l'ontologie. Ce processus est fondĂ© principalement sur un calcul d'associations sĂ©mantiques entre des Vecteurs Conceptuels. Le modĂšle proposĂ© reprĂ©sente une chaĂźne de traitement (ONTOLOGICO) au sein de la plateforme\ud SATIM. Ce modĂšle vise Ă  assister les experts de domaine dans leur tĂąche de conceptualisation et de maintenance des ontologies en se basant sur un processus itĂ©ratif supportĂ© par un ensemble de modules, en particulier, un extracteur de termes, un lemmatiseur, un segmenteur, un classifieur, un module de raffinement sĂ©mantique basĂ© sur l'Indexation SĂ©mantique Latente et un identificateur de termes reliĂ©s basĂ© sur le calcul de similaritĂ© sĂ©mantique entre les couples de vecteurs conceptuels. La dĂ©couverte de relations entre termes pour les besoins d'une conceptualisation de domaine s'avĂšre ĂȘtre le rĂ©sultat d'une complĂ©mentaritĂ© de traitements appliquĂ©s tant sur des textes de domaine que sur un thĂ©saurus. D'une part, les analyses textuelles fondĂ©es principalement sur l'application de l'Indexation SĂ©mantique Latente sur des classes de termes gĂ©nĂšrent des relations sĂ©mantiques prĂ©cises. D'autre part, l'extraction de relations sĂ©mantiques Ă  partir d'un thĂ©saurus, en se basant sur une reprĂ©sentation par des Vecteurs conceptuels, constitue un choix thĂ©orique judicieux et performant. Ce processus joue en effet, un rĂŽle important dans la complĂ©tude des relations.\ud Ce projet de recherche se place au coeur des Ă©changes entre terminologie et acquisition de connaissances. Il amĂšne une rĂ©flexion sur les divers paliers Ă  envisager dans une telle dĂ©marche de modĂ©lisation de connaissances textuelles pour des objectifs de maintenance d'une ontologie de domaine. La mĂ©thodologie proposĂ©e constitue une aide prĂ©cieuse dans le domaine de la maintenance des ontologies. Elle assiste les terminologues chargĂ©s de naviguer Ă  travers de vastes donnĂ©es textuelles pour extraire et normaliser la terminologie et facilite la tĂąche des ingĂ©nieurs en connaissances, chargĂ©s de modĂ©liser des domaines. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Maintenance d'ontologie, Traitement Automatique du Langage Naturel (TALN), Indexation SĂ©mantique Latente, Vecteurs Conceptuels, Classification automatique, RĂ©seaux de Neurones
    • 

    corecore