236 research outputs found
Les entités nommées : des clés linguistiques pour la conceptualisation
National audiencePartir de textes pour construire des ontologies présente de nombreux avantages. Cela permet notamment de produire des ontologies enrichies d'informations lexicales qui sont précieuses pour toutes les applications d'accès au contenu. La construction d'ontologies à partir de textes est un domaine qui ne cesse d'évoluer. Même si le processus de construction d'ontologies à partir de textes n'est pas entièrement automatique, l'ingénieur de la connaissance peut être guidé durant le processus de construction. Dans cet article, nous montrons que la détection des entités nommées peut servir à enrichir une ontologie existante ou à démarrer une conceptualisation et pas seulement à peupler une ontologie. Ce propos est illustré par deux cas d'usage portant sur des documents réglementaires et nous évaluons notre approche en comparant les ontologies construites par rapport à des références. Mots clés : construction d'ontologies, entité nommée, conceptualisation
Integration of the DOLCE top-level ontology into the OntoSpec methodology
This report describes a new version of the OntoSpec methodology for ontology
building. Defined by the LaRIA Knowledge Engineering Team (University of
Picardie Jules Verne, Amiens, France), OntoSpec aims at helping builders to
model ontological knowledge (upstream of formal representation). The
methodology relies on a set of rigorously-defined modelling primitives and
principles. Its application leads to the elaboration of a semi-informal
ontology, which is independent of knowledge representation languages. We
recently enriched the OntoSpec methodology by endowing it with a new resource,
the DOLCE top-level ontology defined at the LOA (IST-CNR, Trento, Italy). The
goal of this integration is to provide modellers with additional help in
structuring application ontologies, while maintaining independence
vis-\`{a}-vis formal representation languages. In this report, we first provide
an overview of the OntoSpec methodology's general principles and then describe
the DOLCE re-engineering process. A complete version of DOLCE-OS (i.e. a
specification of DOLCE in the semi-informal OntoSpec language) is presented in
an appendix
Prise en compte de l'application dans la constitution de produits terminologiques
International audienceLes produits terminologiques se trouvent de plus en plus utilisés dans différents types d'applications informatiques où textes et connaissances jouent un rôle privilégié. Leur constitution à partir de textes requiert de définir un cadre méthodologique situant l'usage d'outils et techniques de traitement de la langue. Nous montrons que la nature de l'application visée conditionne chacune des étapes de ce processus, depuis la constitution du corpus jusqu'à la structuration des connaissances
Context and Keyword Extraction in Plain Text Using a Graph Representation
Document indexation is an essential task achieved by archivists or automatic
indexing tools. To retrieve relevant documents to a query, keywords describing
this document have to be carefully chosen. Archivists have to find out the
right topic of a document before starting to extract the keywords. For an
archivist indexing specialized documents, experience plays an important role.
But indexing documents on different topics is much harder. This article
proposes an innovative method for an indexing support system. This system takes
as input an ontology and a plain text document and provides as output
contextualized keywords of the document. The method has been evaluated by
exploiting Wikipedia's category links as a termino-ontological resources
Modélisation du domaine par une méthode fondée sur l'analyse de corpus (2000)
12 pagesNational audienceLes nombreux travaux actuels sur les ontologies et modèles de domaines, justifiés par la perspective de leur réutilisabilité, proposent très peu de solutions aux problèmes pratiques de recueil et de structuration de ces connaissances. Cet article propose une méthode de construction de modèles de domaine ou d'ontologies, dont l'originalité est de se fonder sur l'analyse de corpus en utilisant ses principes linguistiques et ses logiciels de traitement automatique de la langue. Cette démarche se veut un complément efficace et précis aux méthodes classiques de modélisation du domaine à partir d'expertises individuelles
From Linguistics to Ontologies The Role of Named Entities in the Conceptualisation Process
International audienceOntologies that have been built from texts can be associated with lexical information that is crucial for the semantic annotation of texts and all semantic search tasks. However, the entire pocess of building ontologies from texts cannot be fully automated and it is important to guide the knowledge engineer during the building process. This paper presents an enriched version of TERMINAE, which is a text-based methodology for ontology design. It combines a fact-based approach of modeling with the more traditional concept-centric one. We show that named entities can be used to enrich an existing ontology and to bootstrap the acquisition process. In other words, named entities are used for the conceptualisation of ontologies and not only for their population. This approach is illustrated on two use-cases based on policy documents and evaluated by measuring the Precision and Recall of the resulting ontologies with respect to pre-existing ontologies independently built by domain experts
Construction d'ontologies Ă partir de textes : la phase de conceptualisation
Dans cet article nous nous interrogeons sur la manière d'outiller la phase de conceptualisation lors de la construction d'une ontologie à partir de textes. La mise en perspective des résultats obtenus à partir de techniques issues de la terminologie et de la fouille de textes est réalisée selon trois plans (discours, linguistique et conceptuel). Cette étude permet de mieux appréhender les moyens envisageables pour outiller efficacement et de façon cohérente le processus de conceptualisation
Comment guider le travail de normalisation terminologique?
National audienceLa normalisation d'un réseau terminologique est une étape importante de la construction d'ontologies dans la méthode Terminae ou simplement pour la construction de thesaurus. Nous montrons comment ce travail de normalisation peut être guidé par des critères de pertinence relatifs au domaine et au discours analysé
Modélisation de Ressources Termino-Ontologiques en OWL
National audienceDans le cadre de recherches menées sur l'indexation sémantique, nous avons été conduits à nous interroger sur l'efficacité générale des modèles actuels de représentation des terminologies au sein des ontologies. Après avoir évoqué leurs limites actuelles, nous proposons un nouveau modèle pour manipuler une ressource termino-ontologique en OWL et nous en décrivons son implémentation prochaine au sein de l'environnement Protégé
- …