17 research outputs found
Construction et enrichissement d'une ontologie Ă partir d'un corpus de textes
Dans cet article, nous proposons un processus de construction et d'enrichissement d'ontologies à partir de textes. Les ontologies sont des structures dans lesquelles les concepts d'un domaine et les relations entre ces concepts sont formellement définis. De plus en plus de travaux font appel à des ontologies mais leur construction et leur enrichissement constituent encore un frein. Notre méthode de construction repose sur la recherche de termes dans les textes. Elle suppose que les associations fréquentes de deux termes au sein de certaines structures syntaxiques peuvent être révélatrices d'une relation sémantique et ainsi constituer des éléments pouvant être intégrés dans l'ontologie. L'identification des termes et des structures syntaxiques se fait grâce à un analyseur syntaxique partiel et robuste. Ces éléments constituent la base des données sur laquelle opère le processus de fouille – extraction de motifs fréquents – mis en oeuvre pour extraire des régularités
Hi\'{e}rarchisation des r\`{e}gles d'association en fouille de textes
Extraction of association rules is widely used as a data mining method.
However, one of the limit of this approach comes from the large number of
extracted rules and the difficulty for a human expert to deal with the totality
of these rules. We propose to solve this problem by structuring the set of
rules into hierarchy. The expert can then therefore explore the rules, access
from one rule to another one more general when we raise up in the hierarchy,
and in other hand, or a more specific rules. Rules are structured at two
levels. The global level aims at building a hierarchy from the set of rules
extracted. Thus we define a first type of rule-subsomption relying on Galois
lattices. The second level consists in a local and more detailed analysis of
each rule. It generate for a given rule a set of generalization rules
structured into a local hierarchy. This leads to the definition of a second
type of subsomption. This subsomption comes from inductive logic programming
and integrates a terminological model
Fouille de données textuelles complexes
Stage de DEA. Rapport de stage.L'extraction de connaissances à partir d'une base de textes à pour but de partir de textes bruts pour arriver à des connaissances évaluées par un analyste. Notre travail se situe dans le cadre de la fouille de données qui est une étape du processus d'extraction de connaissances à partir d'une base de textes "ECT". Dans la fouille de données il est important de ressortir les liens entre les textes, entre les termes qui les composent, et entre les textes et les termes. Les règles d'association sont une méthode de fouille, qui nous permet de ressortir tous ces différents liens, mais lorsque la base de textes est volumineuse, le nombre de règles devient difficilement gérable. || The Knowledge Discovery in Texts base means to start from crude texts and arrive to knowledge evaluated by an analyst. Our word is in the data mining context which is a stage of the Knowledge Discovery Texts base. In data mining, it is important to extra
A Proposal for an Interactive Ontology Design Process based on Formal Concept Analysis
ISBN : 978-1-58603-923-3International audienceBuilding a domain ontology usually requires several resources of different types, e.g. thesaurus, object taxonomies, terminologies, data\-bases, sets of documents, etc. where objects are described in terms of attributes and relations with other objects. One important and hard problem is to be able to combine and merge knowledge units extracted from these different resources within the representation formalism supporting the ontology. The purpose of this paper is to show which kinds of resources can be taken as starting points for building an ontology, using FCA and its extension RCA. A real-world example in microbiology is proposed, detailing the interaction with domain experts during the ontology design process. Finally, an evaluation based on recall and precision gives an idea of the efficiency of the approach and points out several research perspectives
L'analyse Formelle de Concepts au service de la construction et l'enrichissement d'une ontologie
National audienceDans cet article, nous proposons une méthodologie appelée PACTOLE "Property And Class Caracterisation from Text to OntoLogy Enrichment" qui permet de construire une ontologie dans un domaine spécifique et pour une ap- plication donnée. PACTOLE fusionne et combine différentes ressources à l'aide de l'Analyse Formelle de Concepts (AFC) et de son extension l'Analyse Rela- tionnelle de Concepts (ARC). Les expressions produites par AFC/ARC sont re- présentées en expressions d'une Logique de Descriptions LD (ici FLE) puis implémentées en OWL. Il est ensuite possible de raisonner sur ces expressions. Cette méthodologie est appliquée au domaine de l'astronomie. Nous montrons aussi comment nous avons formalisé et répondu à certaines questions que se posent les astronomes
Construction d'ontologie Ă partir de corpus de textes
National audienceCet article présente une méthode semi-automatique de construction d'ontologie à partir de corpus de textes sur un domaine spécifique. Cette méthode repose en premier lieu sur un analyseur syntaxique partiel et robuste des textes, et en second lieu, sur l'utilisation de l'analyse formelle de concepts "FCA" pour la construction de classes d'objets en un treillis de Galois. La construction de l'ontologie, c'est à dire d'une hiérarchie de concepts et d'instances, est réalisée par une transformation formelle de la structure du treillis. Cette méthode s'applique dans le domaine de l'astronomie
PACTOLE: A methodology and a system for semi-automatically enriching an ontology from a collection of texts
International audiencePACTOLE stands for ``Property And Class characterization from Text for OntoLogy Enrichment'' and is a semi-automatic methodology for enriching an initial ontology from a collection of texts in a given domain. PACTOLE is also the name of the associated system relying on Formal Concept Analysis (FCA). In this way, PACTOLE is able to derive a concept lattice from a formal context, consisting of a binary table describing a set of individuals with their properties. Given a domain ontology and a set of objects with their properties (extracted from a collection of texts), the PACTOLE system builds two concept lattices: the first corresponding to the restriction of the ontology schema to the considered objects and the second to the extracted pairs (object, property). As they are based on the same set of individuals, the two ontologies are merged using context apposition. The resulting final concept lattice is analyzed and a number of knowledge units can be extracted and furthermore used for enriching the initial ontology. Finally, the final concept lattice is mapped within the KR formalism. The paper introduces and explains in details the PACTOLE methodology with the help of an example in the domain of astronomy
Construction d'une ontologie Ă partir d'un corpus de textes avec l'ACF
National audienceNous présentons dans cet article une méthodologie semi-automatique de construction d'ontologie à partir de corpus de textes sur un domaine spécifique. Cette méthodologie repose en premier lieu sur la classification d'objets d'après les propriétés qu'ils partagent, en utilisant l'analyse de concepts formels (ACF) pour la construction d'un treillis de concepts. Ce treillis va servir à construire un noyau d'ontologie. Cependant, les objets sont aussi définis par les relations qu'ils entretiennent entre eux. Donc, en second lieu, nous proposons une méthode originale qui enrichit cette ontologie avec des relations transversales en utilisant une nouvelle méthode : l'analyse relationnelle de concepts (ARC). Chaque concept de l'ontologie résultante est défini puis représenté en Logique de Descriptions (LDs). Le domaine d'application de cette méthodologie est le domaine de l'astronomie
TAAABLE: Text Mining, Ontology Engineering, and Hierarchical Classification for Textual Case-Based Cooking
International audienceThis paper presents how the Taaable project addresses the textual case-based reasoning challenge of the CCC, thanks to a combination of principles, methods, and technologies of various fields of knowledge-based system technologies, namely CBR, ontology engineering manual and semi-automatic), data and text-mining using textual resources of the Web, text annotation (used as an indexing technique), knowledge representation, and hierarchical classification. Indeed, to be able to reason on textual cases, indexing them by a formal representation language using a formal vocabulary has proven to be useful
Analyses formelle et relationnelle de concepts pour la construction d'ontologies de domaines à partir de ressources textuelles hétérogènes
Ontologies are used in different fields like the semantic Web or the knowledge engineering. Ontologies allow to share, to diffuse and to update knowledge domain. This thesis proposes a methodology to build ontologies using methods of Natural Language Processing (NLP) and Information Extraction (IE) for extracting prepared data from each kind of available resources in the domain (text corpora, databases, thesaurus). Then, these prepared data are mining two mining methods : Formal Concept Analysis (FCA) and Relational Concept Analysis (RCA). The FCA regroups a set of objects sharing the same set of attributes in the same concept. The RCA, an extension of the FCA regroups a set of objects sharing the same attributes and the same relations (relational attributes) in the same concept. The apposition of contexts, a property of the FCA, affects a set of attributes and relational attributes to classes pre-defined and hierarchised by the domain experts. These affectations allow us to present classes and their definitions to the experts of domain as well as new nonexistent classes in the initial hierarchy. These new classes can be considered appropriate and added by experts as new "knowledge units". The Lattices resulting from the data mining methods are considered as « ontology schema ». This ontology schema is represented in the FLE description logics language to obtain ontology. This ontology, is implemented in the OWL, allows us to request it. This methodology was tested in different domains: Microbiology and Astronomy.Les ontologies sont diversement employées notamment dans les domaines du Web sémantique, de l'ingénierie des connaissances,... En effet, elles permettent de partager, de diffuser et d'actualiser les connaissances d'un domaine. Afin de construire ces ontologies, notre méthodologie utilise tout d'abord des méthodes de Traitement Automatique de la Langue Naturelle (TALN) et d'Extraction d'Information (EI) pour extraire des données préparées à partir de chaque ressource du domaine (corpus de textes, bases de données, thesaurus). Puis, ces données sont fouillées avec les méthodes de fouilles : l'Analyse Formelle de concepts (AFC) et l'Analyse Relationnelle de Concepts (ARC). L'AFC regroupe des objets partageant les mêmes attributs dans des concepts d'un treillis. L'ARC, une extension de l'AFC, permet de regrouper des objets partageant les mêmes attributs, mais aussi les mêmes attributs relationnels. L'apposition de contextes (une propriété de l'AFC) permet d'associer ces attributs et relations à un ensemble de classes prédéfinies et hiérarchisées par les experts du domaine. De cette façon, des définitions étendues sont proposées aux experts du domaine pour ces classes prédéfinies ainsi que de nouvelles classes inexistantes dans la hiérarchie initiale. Ces nouvelles classes peuvent être considérées pertinentes et ajoutées par les experts en tant que nouvelles "unités de connaissances". Les treillis résultant des méthodes de fouille constituent ce que nous appelons schéma d'ontologie. Ce schéma d'ontologie est ensuite représenté par le langage FLE de la famille des logiques de descriptions afin d'avoir une ontologie. Cette ontologie, implémentée en OWL, a permis à notre système de répondre automatiquement à différentes questions proposées par les experts du domaine.Des expériences pratiques ont été menées dans deux domaines d'application : l'astronomie et la microbiologie