Search CORE

124 research outputs found

Correction d'ontologies construites à partir de la structure de documents

Author: Aussenac-Gilles Nathalie
Kamel Mouna
Laignelet Marion
Publication venue: Ecole des Mines d'Alès
Publication date: 08/06/2010
Field of study

National audienceLes logiciels de construction d'ontologies à partir de textes réalisent une interprétation fixée a priori du contenu des textes, qu'un expert du domaine ou une ontologie doit vérifier. Or une étude précise des limites des techniques d'analyse des textes permet de guider la correction de l'ontologie apprise en définissant des règles d'aide à la correction. Ces règles attirent l'attention de l'ontographe sur des parties d'ontologie contenant des « anomalies » et tiennent compte du texte d'origine et de l'analyse réalisée pour proposer des corrections. Dans cet article, nous illustrons la notion de règle de correction dans le cas où les connaissances apprises viennent de l'exploitation de structures énumératives parallèles présentes en corpus

Scientific Publications of the University of Toulouse II Le Mirail

HAL Descartes

Propositions de méthodologies pour la valorisation de la médecine traditionnelle fondées sur une ontologie

Author: N'GUESSAN Behou Gérard
Publication venue: HAL CCSD
Publication date: 29/02/2016
Field of study

The work presented in this thesis focuses on the problematic of the valorization of traditional medicine. Traditional medicine is a very rich biological andcultural diversity. His practise is widespread and occurs in various forms. The valorization of this medicine is now a very important issue; it will capitalize this knowledge to popularize, and thus improve its performance in terms of diagnosis, treatment and cost. World Health Organization (WHO)proposes its integration into the national health system. But the practice and exercise of this medicine face many problems which make its implementation difficult. Among these problems, we can list the informal nature of its practice, its content is not formalized, its access mode is not determined, etc. We propose in this thesis, practices more efficient based on the new technology of information and communications; they based specifically on semantic resource such as the ontology which is the formal structure of an acquaintance. The methods proposed in this thesis allow to formalize the contents of this medicine, to facilitate its exercise and ultimately to succeed its revalorization.Le travail présenté dans cette thèse porte sur la problématique de la valorisation de la médecine traditionnelle. La médecine traditionnelle est d’une diversité biologique et culturelle très riche. Sa pratique est très répandue et se fait sous des formes variées . La valorisation de cette médecine constitue aujourd’hui un enjeu très important ; elle permettra de capitaliser ce savoir, de le vulgariser, et donc d’améliorer ses prestations en termes de diagnostic, de traitement et de coût. L’Organisation Mondiale de la Santé (OMS) propose, du reste, de l’intégrer dans le système national de santé. Mais la pratique et l’exercice de cette médecine rencontrent de nombreux problèmes qui rendent son application difficile. Parmi ces problèmes, nous pouvons relever le caractère informel de sa pratique, son contenu non formalisé, son mode d’accès non déterminé, etc. Nous proposons, dans cette thèse, des techniques de pratiques plus efficaces puisque basées sur les nouvelles technologies de l’information et de la communication ; celles-ci reposent plus spécifiquement sur la ressource sémantique telle que l’ontologie qui est la structuration formelle d’une connaissance. Les méthodes proposées dans cette thèse permettent de formaliser le contenu de cette médecine, pour en faciliter l’exercice et en définitive, pour aboutir à sa revalorisation

Thèses en Ligne

Représentation multi-facette des documents pour leur accès sémantique

Author: Ralalason Bachelin
Publication venue
Publication date: 30/09/2010
Field of study

La recherche d'information (RI) est un domaine prépondérant dans la vie contemporaine car elle permet de disposer d'éléments d'informations qui permettent d'agir et de prendre des décisions face à une situation donnée. En effet, l'objectif d'une RI est de s'informer, d'apprendre de nouvelles notions que nous ne maîtrisons pas. La disponibilité et la pertinence de ces nouvelles informations ont donc une très grande influence sur la prise de décision. La plupart des moteurs de recherche actuels utilisent des index regroupant les mots représentatifs des documents afin de permettre leur recherche ultérieure. Dans ces méthodes, les documents et les requêtes sont considérées comme des sacs de mots, non porteurs de sens. L'une des méthodes innovantes actuelles est l'indexation et la recherche sémantique des documents. Il s'agit de mieux prendre en compte le besoin de l'utilisateur en considérant la sémantique des éléments textuels. Nous nous intéressons à cet aspect de la RI en considérant une indexation et une recherche à base d'ontologies de domaine. Les solutions que nous proposons visent à améliorer la pertinence des réponses d'un système par rapport au thème de la recherche. Le discours contenu dans un document ou dans une requête ne sont pas les seuls éléments à prendre en compte pour espérer mieux satisfaire l'utilisateur. D'autres éléments relatifs au contexte de sa recherche doivent aussi être pris en compte. La granularité des informations à restituer à l'utilisateur est un autre aspect. Nous nous sommes intéressés à ces différents aspects et avons développé un méta-modèle de représentation multi-facette des documents en vue de leur accès sémantique. Dans notre modèle, le document est vu selon différentes dimensions dont la structure logique, la structure physique, la sémantique des contenus ainsi que leurs évolutions dans le temps. Nous avons également proposé des mesures de similarité sémantique entre concepts et une fonction de similarité entre les graphes d'annotation des requêtes et ceux des documents. Pour évaluer et valider nos solutions, nous avons instancié ce modèle dans trois domaines distincts : l'apprentissage en ligne, la maintenance automobile et les partitions musicales Braille. Nous avons également évalué les résultats en termes de rappel/précision des fonctions que nous avons proposées et montré leur supériorité par rapport à l'état de l'art.Information retrieval is part of our contemporary life because it helps us to find information which helps us in acting and decision making. Indeed, the objective of any information retrieval task is to learn new facts, new notions. Thus, the availability and relevance of the pieces of new information we access have a high influence on decisions we make. Most of the current search engines use indexes composed of the representative words from the documents; these indexes allow their access when compared to users' queries. These techniques consider documents and queries as bags of words but not the discourse they contain. One of the new methods to face the understanding of user's needs is semantic indexing and retrieval. In this thesis, we consider semantic indexing when based on ontologies that gather the domain knowledge. Matching content is not the only aspects that interest the user when searching for information. We consider other aspects such as the granularity of the elements to retrieve, the meta-data that can be associated with contents and the context in which the search is made. We consider these different aspects and propose a generic model based on a multi-facet representation. The facet related to document content is deeply studied. We made proposition related to semantic retrieval based on graph concepts and suggested a family of concept similarity functions and a graph similarity function that allow to compare graph concepts from documents and from queries. The dynamic aspect of the document collection has also been studied. To validate this model we considered three application domains: e-learning, automobile diagnostic and Braille musical scores. We also evaluate our semantic similarity functions in terms of recall and precision and show their effectiveness

Thèses en Ligne

Scientific Publications of the University of Toulouse II Le Mirail

HAL Descartes

Thèses en ligne de l'Université Toulouse III - Paul Sabatier

Modélisation de documents et recherches de points communs : propositions d'un framework de gestion de fiches d'anomalie pour faciliter les maintenances corrective et préventive

Author: Claude Grégory
Publication venue
Publication date: 16/05/2012
Field of study

La pratique quotidienne d'une activité génère un ensemble de connaissances qui se traduisent par un savoir-faire, une maîtrise, une compétence qu'une personne acquiert au cours du temps. Pour les préserver, la capitalisation des connaissances est devenue une activité essentielle dans les entreprises. Nos travaux de recherche ont pour objectif de modéliser et mettre en œuvre un système afin d'extraire et de formaliser les connaissances issues des anomalies qui surviennent dans un contexte de production industrielle et de les intégrer dans un framework facilitant la maintenance corrective et préventive. Ce framework structure la connaissance sous la forme de groupes d'anomalies. Ces groupes peuvent être rapprochés des patterns : ils représentent un problème auquel une ou plusieurs solutions sont associées. Ils ne sont pas définis a priori, c'est l'analyse des anomalies passées qui génère des groupes pertinents, qui peuvent évoluer avec l'ajout de nouvelles anomalies. Pour identifier ces patterns, supports de la connaissance, un processus complet d'extraction et de formalisation de la connaissance est suivi, Knowledge Discovery in Databases. Ce processus a été appliqué dans des domaines très variés. Nous lui donnons ici une nouvelle dimension, le traitement d'anomalies et plus particulièrement celles qui surviennent au cours de processus de production industrielle. Les étapes génériques qui le composent, depuis la simple sélection des données jusqu'à l'interprétation des patterns qui supportent les connaissances, sont considérées pour affecter à chacune un traitement spécifique pertinent par rapport à notre contexte applicatif.The daily practice of an activity generates a set of knowledge that results in a know-how, a mastery, a skill a person gains over time. In order to take advantage of this experience, capitalization of knowledge has become an essential activity for companies. Our research work aims to model and implement such a system that extracts and formalizes knowledge from defects that occur in the context of industrial production, and to integrate it into a framework in order to facilitate corrective and preventive maintenance. This framework organizes the knowledge in the form of defects' groups. These groups can be compared to patterns: they represent a problem to which one or more solutions are related. They are not defined a priori; the analysis of past defects generates relevant groups, which may change with the addition of new defects. To identify these patterns, a complete process of knowledge extraction and formalization is adopted, Knowledge Discovery in Databases, well known in the domain of knowledge management. This process has been applied in very diversified fields. In this work, we give a new dimension to this process, the processing of defects, especially those that occur during industrial production processes. The generic steps that compose it, from the simple data selection to the interpretation of patterns that support knowledge, are considered. A specific processing, relevant to our applicative context, is assigned to each of these steps

Thèses en ligne de l'Université Toulouse III - Paul Sabatier

L’impact de la prise en charge des couches sémantiques sur la recherche d'information touristique : Cas des établissements et services touristiques digitalisés au Maroc

Author: Amalki Asma
Bouzit Ali
Tatane Khalid
Publication venue: NMd, Núcleo Multidisiplinar
Publication date: 07/07/2023
Field of study

Tourism is an economic and a wealth-creating pillar that involves several volatile actors that are rich in dynamic, complex and heterogeneous information (Benckendorff et al., 2019). Therein, the continuous increase in the volume of information available on tourism offerings on the web has made user decision making a crucial task. As a result, the use of personalized and intelligent recommendation systems is essential for the satisfaction of tourism consumers (Grün et al., 2017). The objective of this article is to reveal the impact of the deployment of semantic techniques on the quality and accuracy of search results for tourism information, in the case of tourism in Morocco. This will be done through ontologies, which are a key component in the semantic web (Buhalis, 2020). To this end, we first presented the implementation of the semantic web and the use of ontologies in it. Then, we described the basic background of ontologies. Finally, we discussed the existing ontologies in the tourism domain in Morocco.The findings show that, the assumption of ontological conceptualization during the creation of digital content by tourism establishments, as a context-aware knowledge base, ensures the implementation of a semantic correspondence between users' preferences and the characteristics of tourism offers published, thus improving the quality and accuracy of the recommendations according to the user's context (Abbasi-Moud et al., 2022). Nevertheless, the evolution of tourism ontologies following changes in this sector is of major complexity. For this reason, the invention of an automatic approach, based on artificial intelligence techniques, NLP, Machine Learning or Deep Learning, can contribute to an evolutionary, reliable and easier maintenance of tourism ontologies, in the Moroccan context.Le tourisme est un pilier économique et créateur de richesse, impliquant plusieurs acteurs instables, riche en informations dynamiques, complexes et hétérogènes (Benckendorff et al., 2019). De ce fait, l'augmentation continue du volume d'informations sur les offres touristiques disponibles sur le web a rendu la prise de décision des utilisateurs une tâche cruciale. Par suite, l’utilisation des systèmes de recommandation personnalisés et intelligents est indispensable pour la satisfaction des consommateurs du tourisme (Grün et al., 2017). L’objectif de cet article est de montrer l’impact du déploiement des techniques sémantiques sur la qualité et la précision des résultats de la recherche des renseignements touristiques, cas du tourisme au Maroc. Cela à travers les ontologies, composante clé dans le web sémantique (Buhalis, 2020). Pour ce faire, nous avons présenté, d’abord, la mise en œuvre du web sémantique et l’utilisation des ontologies dans ce dernier. Ensuite, nous avons décrit le contexte fondamental des ontologies. Et enfin, nous avons discuté les ontologies existantes dans le domaine touristique au Maroc.Les résultats de cet article montrent que, la prise en charge de la conceptualisation ontologique lors de la création des contenus digitaux par les établissements touristiques, comme une base de connaissance consciente du contexte, assure la mise en place d’une correspondance sémantique entre les préférences des utilisateurs et les caractéristiques des offres touristiques publiées, ce qui permet d’améliorer la qualité et la précision des recommandations, selon le contexte de l’utilisateur (Abbasi-Moud et al., 2022). Néanmoins, l’évolution des ontologies du tourisme suite aux changements de ce secteur, est d’une complexité majeur. Pour cette raison, l’invention d’une approche automatique, à base des techniques de l’intelligence artificielle, TAL, Machine Learning ou Deep Learning, peut contribuer à une maintenance évolutive, fiable et plus aisée des ontologies du tourisme, dans le contexte marocain

RevistaMultidisciplinar

Modélisation de documents et recherche de points communs - Proposition d'un framework de gestion de fiches d'anomalie pour faciliter les maintenances corrective et préventive

Author: Claude Grégory
Publication venue: HAL CCSD
Publication date: 16/05/2012
Field of study

The daily practice of an activity generates a set of knowledge that results in a know-how, a mastery, a skill a person gains over time. In order to take advantage of this experience, capitalization of knowledge has become an essential activity for companies. Our research work aims to model and implement such a system that extracts and formalizes knowledge from defects that occur in the context of industrial production, and to integrate it into a framework in order to facilitate corrective and preventive maintenance. This framework organizes the knowledge in the form of defects' groups. These groups can be compared to patterns: they represent a problem to which one or more solutions are related. They are not defined a priori; the analysis of past defects generates relevant groups, which may change with the addition of new defects. To identify these patterns, a complete process of knowledge extraction and formalization is adopted, Knowledge Discovery in Databases, well known in the domain of knowledge management. This process has been applied in very diversified fields. In this work, we give a new dimension to this process, the processing of defects, especially those that occur during industrial production processes. The generic steps that compose it, from the simple data selection to the interpretation of patterns that support knowledge, are considered. A specific processing, relevant to our applicative context, is assigned to each of these steps.La pratique quotidienne d'une activité génère un ensemble de connaissances qui se traduisent par un savoir-faire, une maîtrise, une compétence qu'une personne acquiert au cours du temps. Pour les préserver, la capitalisation des connaissances est devenue une activité essentielle dans les entreprises. Nos travaux de recherche ont pour objectif de modéliser et mettre en œuvre un système afin d'extraire et de formaliser les connaissances issues des anomalies qui surviennent dans un contexte de production industrielle et de les intégrer dans un framework facilitant la maintenance corrective et préventive. Ce framework structure la connaissance sous la forme de groupes d'anomalies. Ces groupes peuvent être rapprochés des patterns : ils représentent un problème auquel une ou plusieurs solutions sont associées. Ils ne sont pas définis a priori, c'est l'analyse des anomalies passées qui génère des groupes pertinents, qui peuvent évoluer avec l'ajout de nouvelles anomalies. Pour identifier ces patterns, supports de la connaissance, un processus complet d'extraction et de formalisation de la connaissance est suivi, Knowledge Discovery in Databases. Ce processus a été appliqué dans des domaines très variés. Nous lui donnons ici une nouvelle dimension, le traitement d'anomalies et plus particulièrement celles qui surviennent au cours de processus de production industrielle. Les étapes génériques qui le composent, depuis la simple sélection des données jusqu'à l'interprétation des patterns qui supportent les connaissances, sont considérées pour affecter à chacune un traitement spécifique pertinent par rapport à notre contexte applicatif

Thèses en Ligne

Scientific Publications of the University of Toulouse II Le Mirail

Un système data mining en ligne pour la maintenance ontologique d'une mémoire corporative DM

Author: Djellali Choukri
Publication venue
Publication date
Field of study

L'intégration de la connaissance dans la mémoire corporative (Ribière et Matta, 1998), (Dieng et al., 1998) fait face à l'hétérogénéité des données (Visser, Jones et al., 1997). L'utilisation de l'ontologie est une approche possible pour surmonter ce problème. Cependant, l'ontologie est une structure de donnée comme n'importe quelle structure informatique, elle est donc dynamique et évolue dans le temps à cause des conditions dynamiques résultant des changements du domaine conceptuel, les changements de conceptualisation, les changements de spécification, les changements descendants, etc. (Yildiz, 2006). Ces dernières années, plusieurs approches ont été proposées pour résoudre le problème de la maintenance des ontologies. Cependant, la précision et le rappel ne permettent pas de satisfaire les besoins des utilisateurs. De plus, ces approches ne prennent pas en compte toute l'information disponible pour prendre une décision réaliste. Pour résoudre le problème de l'évolution de la connaissance dans les ontologies, nous proposons une approche hybride qui utilise l'apprentissage machine et un processus d'alignement qui contrôle les relations syntaxiques entre les entrées dans l'ontologie. De plus, des règles structurelles et des heuristiques sont appliquées pour améliorer le degré de similitude entre les entités ontologiques. Ce processus hybride crée des règles de correspondance qui définissent comment transformer les entrées dans l'ontologie en définissant tous les types d'associations possibles entre les entités ontologiques. L'approche d'enrichissement de l'ontologie exploite les techniques de la fouille de données, les techniques du traitement automatique du langage naturel et la recherche d'information pour améliorer la performance d'apprentissage durant la tâche d'enrichissement du domaine conceptuel. L'évaluation des ontologies demeure un problème important et le choix d'une approche appropriée dépend des critères utilisés. Dans notre approche, nous adoptons la vérification de la cohérence décrite dans (Maziar Amirhosseini et al., 2011) et (Abderrazak et al., 2011).\ud ______________________________________________________________________________ \ud MOTS-CLÉS DE L’AUTEUR : Data Mining, Traitement automatique du langage naturel, Apprentissage machine, Recherche d'information, Intégration, Ontologie, Mémoire corporative, Web sémantique

Archipel - Université du Québec à Montréal

Data Warehouse Design and Textual Data

Author: SCHINCKUS Malik
Publication venue
Publication date: 22/06/2023
Field of study

Repository of the University of Namur

Contribution à la maintenance des ontologies à partir d'analyses textuelles : extraction de termes et de relations entre termes

Author: Gargouri Yassine
Publication venue
Publication date: 01/01/2009
Field of study

Les ontologies sont des nouvelles formes de contrôle intelligent de l'information. Elles présentent un savoir préalable requis pour un traitement systématique de l'information à des fins de navigation, de rappel, de précision, etc. Toutefois, les ontologies sont confrontées de façon continue à un problème d'évolution. Étant donné la complexité des changements à apporter, un processus de maintenance, du moins semi-automatique, s'impose de plus en plus pour faciliter cette tâche et assurer sa fiabilité.\ud L'approche proposée trouve son fondement dans un modèle cognitif décrivant un processus d'extraction de connaissances à partir de textes et de thésaurus. Nous mettons ainsi, les textes au centre du processus d'ingénierie des connaissances et présentons une approche se démarquant des techniques formelles classiques en représentation de connaissances par son indépendance de la langue. Les traitements textuels sont fondés principalement sur un processus de classification supporté par un réseau de neurones (ART 1) et sur l'Indexation Sémantique Latente appliquée sur des classes de termes. Partant de l'hypothèse que l'extraction -de connaissances à partir de textes ne peut se contenter d'un traitement statistique (ni même linguistique) de données textuelles pour accaparer toute leur richesse sémantique, un processus d'extraction de connaissances à partir d'un thésaurus a été conçu afin d'intégrer, le mieux possible, les connaissances du domaine au sein de l'ontologie. Ce processus est fondé principalement sur un calcul d'associations sémantiques entre des Vecteurs Conceptuels. Le modèle proposé représente une chaîne de traitement (ONTOLOGICO) au sein de la plateforme\ud SATIM. Ce modèle vise à assister les experts de domaine dans leur tâche de conceptualisation et de maintenance des ontologies en se basant sur un processus itératif supporté par un ensemble de modules, en particulier, un extracteur de termes, un lemmatiseur, un segmenteur, un classifieur, un module de raffinement sémantique basé sur l'Indexation Sémantique Latente et un identificateur de termes reliés basé sur le calcul de similarité sémantique entre les couples de vecteurs conceptuels. La découverte de relations entre termes pour les besoins d'une conceptualisation de domaine s'avère être le résultat d'une complémentarité de traitements appliqués tant sur des textes de domaine que sur un thésaurus. D'une part, les analyses textuelles fondées principalement sur l'application de l'Indexation Sémantique Latente sur des classes de termes génèrent des relations sémantiques précises. D'autre part, l'extraction de relations sémantiques à partir d'un thésaurus, en se basant sur une représentation par des Vecteurs conceptuels, constitue un choix théorique judicieux et performant. Ce processus joue en effet, un rôle important dans la complétude des relations.\ud Ce projet de recherche se place au coeur des échanges entre terminologie et acquisition de connaissances. Il amène une réflexion sur les divers paliers à envisager dans une telle démarche de modélisation de connaissances textuelles pour des objectifs de maintenance d'une ontologie de domaine. La méthodologie proposée constitue une aide précieuse dans le domaine de la maintenance des ontologies. Elle assiste les terminologues chargés de naviguer à travers de vastes données textuelles pour extraire et normaliser la terminologie et facilite la tâche des ingénieurs en connaissances, chargés de modéliser des domaines. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Maintenance d'ontologie, Traitement Automatique du Langage Naturel (TALN), Indexation Sémantique Latente, Vecteurs Conceptuels, Classification automatique, Réseaux de Neurones

Archipel - Université du Québec à Montréal

Comparaison de logiciels d'analyse de texte

Author: Lattinne Elisabeth
Publication venue
Publication date: 01/01/2008
Field of study

Repository of the University of Namur