5 research outputs found

    Evolution cohérente des ressources termino-ontologiques et des annotations sémantiques

    Get PDF
    Un des enjeux du web sémantique est de produire des caractérisations formelles de contenus documentaires, ou annotations sémantiques, de qualité. Or dans un environnement dynamique, les ressources termino-ontologiques et les annotations sémantiques qu'elles permettent de construire doivent être modifiées régulièrement et en cohérence pour s'adapter à l'évolution du domaine concerné et des collections documentaires annotées. Notre contribution est une méthode qui permet de gérer conjointement l'évolution d'une ressource termino-ontologique et d'annotations sémantiques produites à partir de cette ressource. La méthode définit les types de changements applicables (élémentaires ou complexes), ainsi que des stratégies d'évolution de la ressource et des annotations. Cette méthode est mise en œuvre par le logiciel EvOnto qui s'intègre à l'environnement d'annotation automatique de documents TextViz défini dans le cadre du projet ANR DYNAMO. L'originalité d'EvOnto est de s'adapter à plusieurs scénarios d'évolution suivant que ce soit l'ontologie, la collection documentaire ou les annotations qui soient modifiées. EvOnto assure un support à l'ontologue en le guidant interactivement pour formuler une demande de changement, évaluer son impact (effets supplémentaires) sur la ressource termino-ontologique et aussi sur les annotations sémantiques, et décider ensuite de leur mise en œuvre. Il fournit des informations à l'ontologue pour qu'il décide d'une évolution en connaissant ses conséquences, et qu'il l'adapte pour minimiser les effets négatifs, les impacts non souhaitables ou les coûts correspondants sur la ressource elle-même et son utilisation dans des annotations.One of the challenges of the Semantic Web is to get high quality formal representations that characterize document content, also called semantic annotations. In a dynamic environment, the termino-ontological resources and semantic annotations built thanks to the resources must be regularly and consistently modified to adapt to the evolution of the domain to which they relate and to the annotated document collections. Our contribution is a method to jointly manage the evolution of a termino-ontological resource and semantic annotations built with this resource. The method defines applicable change types (elementary or complex) as well as evolution strategies for both the resource and the document semantic annotations. This method is supported by the EvOnto system that takes place in the TextViz platform for ontology-based automatic document annotation developed in the DYNAMO project. The originality of EvOnto is to preserve the consistency between the termino-ontological resources and the semantic annotations.. EvOnto provides support to the ontologist for different scenarios, and guides him interactively when he requests for a change by assessing its impact (additional effects) on the quality of the termino-ontological resource and also on semantic annotations, and then when he decides on their implementation. EvOnto provides the ontologist with relevant information on the use of ontology so that he takes initiative of a change knowing its consequences, and so that he adapts changes to minimize their negative effects, their undesirable impacts and their related costs on the resource itself and its use in annotations

    Gestion dynamique d'ontologies à partir de textes par systèmes multi-agents adaptatifs

    Get PDF
    Une ontologie est une représentation structurée des connaissances d'un domaine sous la forme d'un réseau conceptuel. Les ontologies sont considérées comme un support indispensable à la communication entre agents logiciels, à l'annotation des sites Web et des ressources documentaires dans une optique de recherche sémantique de l'information. Parce que les connaissances d'un domaine sont amenées à évoluer, une ontologie doit elle aussi évoluer pour rester en cohérence avec le domaine qu'elle modélise. Actuellement, la plupart des travaux traitant de l'évolution d'ontologies se préoccupent de la vérification et du maintien de la cohérence de l'ontologie modifiée. Ces travaux n'apportent pas de solutions concrètes à l'identification de nouvelles connaissances et à leur intégration dans une ontologie. Les travaux en ingénierie d'ontologies à partir de textes quant à eux traitent ce problème d'évolution comme un problème de reconstruction d'une nouvelle ontologie. Souvent, le résultat produit est complètement différent de l'ontologie à modifier. Par ailleurs, les logiciels d'évolution spécifiques à un domaine particulier rendent impossible leur utilisation dans d'autres domaines. Cette thèse propose une solution originale basée sur les systèmes multi-agents adaptatifs (AMAS) pour faire évoluer des ontologies à partir de textes. Chaque terme et concept sont représentés par un agent qui essaie de se situer au bon endroit dans l'organisation qui n'est autre que l'ontologie. Ce travail est concrétisé par un outil nommé DYNAMO. Un besoin d'évolution est déclenché par l'ajout de nouveaux textes dans un corpus de documents. DYNAMO utilise les résultats d'un extracteur de termes et de relations lexicales ainsi qu'un AMAS, nommé DYNAMO MAS, pour proposer une ontologie modifiée à un ontographe. Ce dernier interagit avec DYNAMO MAS via une interface graphique en modifiant l'ontologie proposée (déplacement, ajout, modification de concepts, de termes et/ou de relations), produisant ainsi des contraintes auxquelles l'AMAS doit s'adapter. Cette "coévolution" entre l'AMAS et l'ontographe cesse lorsque l'ontographe juge que l'ontologie modifiée est cohérente avec le nouveau corpus.An ontology is a structured representation of domain knowledge based on a conceptual network. Ontologies are considered as an essential support for the communication between software agents, the annotation of Web sites and textual resources to carry out semantic information retieval. Because domain knowledge can evolve, an ontology must also evolve to remain consistent with the domain that it models. Currently, studies on ontologies evolution are focusing on checking and maintaining the consistency of the evolved ontology. These works do not provide concrete solutions to the identification of new knowledge and its integration into an ontology. Ontology engineering from texts considers evolution as a problem of ontology reconstruction. The result produced by this kind of software is often completely different from the initial ontology. Moreover, it is almost impossible to reuse software designed only for a particular domain. This PhD thesis proposes an original solution based on adaptive multi-agent systems (AMAS) to evolve ontologies from texts. Each term and each concept are agentified and try to find its own right place in the AMAS organization that is the ontology. This work is implemented in a software called DYNAMO. An ontology evolution requirement is triggered by the addition of new texts in a corpus of documents. DYNAMO uses the results of a term extractor and a lexical relation extractor. These results are the input data of an AMAS, called DYNAMO MAS, that evolves an ontology and proposes it to an ontologist. Then, the ontologist interacts with DYNAMO MAS via a graphical interface by modifying the proposed ontology (moving, addition, suppression of concepts, terms and / or relationships). The ontologist's actions are feedback used by the AMAS to adapt the evolved ontology. This "coevolution" process between the AMAS and the ontologist ends when the ontologist judges that the modified ontology is consistent with the new corpus

    Diachronie en langue de spécialité. Définition d'une méthode linguistique outillée pour repérer l'évolution des connaissances en corpus. Un exemple appliqué au domaine spatial.

    Get PDF
    Co-financée par le Centre National d'Études Spatiales et le Centre National de la Recherche Scientifiques (Bourse de Docteur Ingénieur CNRS/Entreprise)This doctoral dissertation explores the question of the diachronic dimension in terminology using a tool-based approach applied to a diachronic corpus. This study focuses on a request from the French National Space Agency (Cnes) where both knowledge and technology necessarily evolve over the course of “long-term” space projects (approx. 20 yrs.). This phenomenon can be tricky and a source of difficulties, such as poor communication with new coming engineers who arrive during the project or unconscious modifications of the meaning or forms of terms, etc. Learning how to identify this evolution is therefore of prime importance. Our research aims at defining a linguistic method to track down knowledge evolution within texts. This aim allows us to structure a triple point of view: a theoretical one, a methodological one and an applied one. To do so, this doctoral dissertation presents a description of four linguistic cues which can be semi-automatically identified in corpora to observe evolution: frequency, contexts of evolution, variants and syntactic dependencies. The cues are studied in two diachronic corpora from the Cnes: one corpus made up of three editions of a course on optics and optoelectronics (1994-2002) and one technical corpus composed of specification reports from the DORIS project (1989-2000). This context makes it possible to offer theoretical and methodological paths in textual terminology to track down, study and characterize the evolution that is likely to appear in specialized fields, especially within an environment that has been very little explored, i.e. short-term diachrony. The approach developed in this study also sheds light on the interpretation of corpus data, firstly, by combining linguistic cues in order to build up a reliable interpretation (or even a diagnosis) of the evolution through linguistic cues; secondly, by reflecting on the place and role of the experts in analyses and by analyst-expert dialoguing as a driving force in the co-construction of interpretations.Dans cette thèse nous abordons la question de la diachronie dans les langues de spécialité à travers la définition d'une méthode linguistique pour repérer l'évolution des connaissances en corpus. Cette recherche s'ancre dans une demande appliquée émanant du Centre National d'Études Spatiales (Cnes), où la question de l'évolution prend une dimension particulière dans le cadre de projets spatiaux dits « de longue durée » (~20 ans), au long desquels les connaissances impliquées évoluent nécessairement. Ce phénomène, inévitable mais parfois insidieux, est susceptible d'entraîner un certain nombre de difficultés telles qu'une mauvaise communication avec les ingénieurs qui arrivent en cours de projet, une modification non consciente du sens/de la forme des termes, etc. L'objectif est donc de proposer une méthode pour repérer cette évolution, objectif qui permet d'articuler un triple regard sur la diachronie : un regard théorique, un regard descriptif et un regard appliqué. Pour ce faire, cette thèse propose la description de quatre indices linguistiques repérables semi-automatiquement en corpus pour observer l'évolution : la fréquence, les contextes d'évolution, les variantes et les dépendances syntaxiques. Ces indices sont explorés à partir de deux corpus diachroniques : trois éditions d'un cours d'optique et optoélectronique (1994-2002) et un corpus de rapports de spécification du projet spatial DORIS (1989-2000). Ce contexte permet de proposer des pistes théoriques et méthodologiques en terminologie textuelle pour repérer, étudier et caractériser l'évolution susceptible de se manifester dans les domaines de spécialité, en particulier sur de très courts intervalles temporels. La démarche mise en place dans cette recherche permet également d'alimenter la question de l'interprétation des données en corpus : tout d'abord à travers la combinaison d'indices comme moyen de construire une interprétation (voire un diagnostic) fiable de l'évolution à partir d'indices linguistiques ; ensuite à travers la question du rôle et de la place des experts dans l'analyse et du dialogue analyste/expert du domaine comme moteurs d'une co-construction de l'interprétation

    Approches organisationnelles pour la conception de systèmes multi-agents dédiés à la gestion des connaissances; Application aux projets d'ingénierie et d'innovation Composition du jury

    Get PDF
    Approches organisationnelles pour la conception de systèmes multi-agents dédiés à la gestion des connaissances; Application aux projets d’ingénierie et d’innovatio

    Terminologie des techniques de décontamination des sols

    Get PDF
    L'objet de cette recherche a été d'établir et de définir une nomenclature des notions de base des techniques de décontamination des terrains, qui comptent parmi les moyens de réhabilitation environnementale. Le résultat des recherches terminologiques a été utilisé afin d'apporter une contribution au développement d'une banque terminologique disponible sur Internet. La méthodologie appliquée est celle de la recherche thématique bilingue : à partir d'un corpus de textes spécialisés, l'on a procédé à la constitution d'une nomenclature, qui a fait l'objet d'une recherche terminologique, tant en langue française qu'en langue anglaise. Les dossiers terminologiques ainsi élaborés ont été validés par un comité d'experts et intégrés sous forme de fiches au Grand dictionnaire terminologique, produit et mis en ligne par l'Office québécois de la langue française
    corecore