76 research outputs found
Treillis de Galois et ontologies de domaine pour la classification et la recherche de sources de données génomiques
Stage de DEA. Rapport de stage.Dans ce mémoire nous présentons une méthode de classification et de recherche de sources génomiques pertinentes pour une question donnée en utilisant les treillis de Galois. Elle consiste à construire le treillis de Galois à partir de la relation binaire entre les sources et leurs propriétés. Ces dernières sont extraites à partir d'un ensemble de métadonnées associées aux sources. Un concept construit à partir d'une requête utilisateur est ensuite inséré dans le treillis. Le calcul du résultat se ramène à extraire l'ensemble des sources figurant dans les extensions des subsumants du concept requête dans le treillis de Galois résultant. L'ordre de pertinence des sources est déduit à partir de l'ordre de spécialisation des concepts correspondants dans le treillis. Une amélioration de la méthode consiste à enrichir la requête à partir d'ontologies de domaine avant de l'insérer dans le treillis. Trois modes d'enrichissement sont possibles: l'enrichissement par généralisation, l'enrichissement par spécialisation et l'enrichissement mixte. || In this document we present an approach to classify and search relevant genomic sources for a given question in a Galois lattice. It consists in building the Galois lattice from the binary relation between sources and their properties. These properties a
Profils patients associés à la non conformité des décisions aux recommandations de prise en charge thérapeutique des cancers du sein : utilisation de l'analyse de concepts formels
International audienceLes systèmes d'aide à la décision médicale permettent d'améliorer le suivi des recommandations de pratique clinique. OncoDoc2 est un tel système s’appuyant sur des recommandations de prise en charge du cancer du sein. Malgré son utilisation en routine lors de réunions de concertation pluridisciplinaire de sénologie, des décisions non conformes aux recommandations subsistent. L'objectif est d'utiliser l'analyse de concepts formels afin de caractériser les profils patients associés aux deux modalités de la conformité. Deux étapes de pré-traitement permettant de simplifier les données à analyser sont proposées : une réduction d'attributs par suppression de ceux non statistiquement associés à la non conformité, et un gommage sélectif de valeurs. Parmi les décisions recueillies sur 3 ans à l'hôpital Tenon, 198 concernent la reprise chirurgicale et ont été analysées. Les profils patients associés à la non conformité retrouvés sont ceux pour lesquels il n'existe pas de preuve scientifique des recommandations. Mots-clés
Méthode sémantique pour la classification et l'interrogation de sources de données biologiques
Nous présentons une méthode de classification et de recherche de sources biologiques. Elle consiste à construire un treillis de Galois à partir d'un ensemble de méta-données associées aux sources et converties en propriétés booléennes. Un concept construit à partir d'une requête utilisateur est ensuite inséré dans le treillis grâce à un algorithme de construction incrémentale. Le calcul du résultat se ramène à extraire l'ensemble des sources figurant dans les extensions des subsumants du concept requête dans le treillis de Galois résultant. L'ordre de pertinence des sources est déduit à partir de l'ordre de subsumption des concepts correspondants dans le treillis. Une amélioration de la méthode consiste à enrichir la requête à partir d'ontologies de domaine avant de l'insérer dans le treillis. Deux modes d'enrichissement sont possibles: l'enrichissement par généralisation et l'enrichissement par spécialisation
Connaissances de domaine et treillis de concepts pour l'exploration progressive de données complexes
National audienceNous présentons dans cet article l'Analyse de Concepts Formels par Similarité, qui adapte et étend l'Analyse de Concepts Formels classique à des données complexes, en s'appuyant sur des connaissances de domaine. Ces connaissances sont considérées pour définir la similarité entre les données qui se présentent sous la forme d'un contexte multivalué. En s'appuyant sur la similarité définie, les données du contexte sont groupées dans des concepts multivalués qui forment des treillis de concepts multivalués. La variation des critères dans la définition de la similarité aboutit à la modification de la structure de treillis obtenue et du niveau de précision dans les concepts. Nous exploitons cet aspect pour définir une méthode d'exploration progressive de données complexes par treillis de concepts multivalués. Nous détaillons l'application de cette méthode à l'organisation et à l'identification des sources de données biologiques de l'annuaire BioRegsity
Treillis de concepts et ontologies pour l'interrogation d'un annuaire de sources de donn\'{e}es biologiques (BioRegistry)
Bioinformatic data sources available on the web are multiple and
heterogenous. The lack of documentation and the difficulty of interaction with
these data sources require users competence in both informatics and biological
fields for an optimal use of sources contents that remain rather under
exploited. In this paper we present an approach based on formal concept
analysis to classify and search relevant bioinformatic data sources for a given
query. It consists in building the concept lattice from the binary relation
between bioinformatic data sources and their associated metadata. The concept
built from a given query is then merged into the concept lattice. The result is
given by the extraction of the set of sources belonging to the extents of the
query concept subsumers in the resulting concept lattice. The sources ranking
is given by the concept specificity order in the concept lattice. An
improvement of the approach consists in automatic query refinement thanks to
domain ontologies. Two forms of refinement are possible by generalisation and
by specialisation.
-----
Les sources de donn\'{e}es biologiques disponibles sur le web sont multiples
et h\'{e}t\'{e}rog\`{e}nes. L'utilisation optimale de ces ressources
n\'{e}cessite aujourd'hui de la part des utilisateurs des comp\'{e}tences \`{a}
la fois en informatique et en biologie, du fait du manque de documentation et
des difficult\'{e}s d'interaction avec les sources de donn\'{e}es. De fait, les
contenus de ces ressources restent souvent sous-exploit\'{e}s. Nous
pr\'{e}sentons ici une approche bas\'{e}e sur l'analyse de concepts formels,
pour organiser et rechercher des sources de donn\'{e}es biologiques pertinentes
pour une requ\^{e}te donn\'{e}e. Le travail consiste \`{a} construire un
treillis de concepts \`{a} partir des m\'{e}ta-donn\'{e}es associ\'{e}es aux
sources. Le concept construit \`{a} partir d'une requ\^{e}te donn\'{e}e est
alors int\'{e}gr\'{e} au treillis. La r\'{e}ponse \`{a} la requ\^{e}te est
ensuite fournie par l'extraction des sources de donn\'{e}es appartenant aux
extensions des concepts subsumant le concept requ\^{e}te dans le treillis. Les
sources ainsi retourn\'{e}es peuvent \^{e}tre tri\'{e}es selon l'ordre de
sp\'{e}cificit\'{e} des concepts dans le treillis. Une proc\'{e}dure de
raffinement de requ\^{e}te, bas\'{e}e sur des ontologies du domaine, permet
d'am\'{e}liorer le rappel par g\'{e}n\'{e}ralisation ou par sp\'{e}cialisatio
BR-Explorer: An FCA-based algorithm for Information Retrieval
In this paper we present BR-Explorer, an FCA-based algorithm that addresses the problem of retrieving the relevant objects for a given query. Initially, a formal context representing the relation between a set of objects and the corresponding set of attributes is given, and the associated concept lattice is built. BR-Explorer starts by generating a formal concept representing the considered query, and classifies this query concept in the concept lattice. Then, BR-Explorer tries to locate the so-called ``pivot'' concept in the concept lattice, for building step by step the query result (considering the pivot superconcepts in the concept lattice). Finally, BR-Explorer returns a set of objects ranked with respect to their relevance w.r.t. the query
Classification et interrogation de sources de données biologiques
Nous présentons une méthode de classification et de recherche de sources biologiques. Elle consiste à construire un treillis de Galois à partir d'un ensemble de méta-données associées aux sources et converties en propriétés booléennes. Un concept construit à partir d'une requête utilisateur est ensuite inséré dans le treillis grâce à un algorithme de construction incrémentale. Le calcul du résultat se ramène à extraire l'ensemble des sources figurant dans les extensions des subsumants du concept requête dans le treillis de Galois résultant. L'ordre de pertinence des sources est déduit à partir de l'ordre de subsumption des concepts correspondants dans le treillis. Une amélioration de la méthode consiste à enrichir la requête à partir d'ontologies de domaine avant de l'insérer dans le treillis. Deux modes d'enrichissement sont possibles: l'enrichissement par généralisation et l'enrichissement par spécialisation
BR-Explorer: A sound and complete FCA-based retrieval algorithm (Poster)
In this paper we present BR-Explorer, a sound and complete biological data sources retrieval algorithm based on Formal Concept Analysis and domain ontologies. BR-Explorer addresses the problem of retrieving the relevant data sources for a given query. Initially, a formal context representing the relation between biological data sources and their metadata is provided and its corresponding concept lattice is built. Then BR-Explorer starts by generating the formal concept for the considered query and inserting it into the provided concept lattice. The next step of BR-Explorer is to locate the "pivot" concept in the resulting concept lattice. Based on this pivot concept, BR-Explorer builds the result step by step by considering the pivot superconcepts in the resulting concept lattice until the top concept is reached. Finally BR-Explorer provides the set of relevant data sources ranked according to their relevance with respect to the considered query. An ontology-based query refinement procedure is integrated in BR-Explorer. This procedure takes advantage of semantic information about the data source metadata and the queries to improve the BR-Explorer results
Correction et complétude d'un algorithme de recherche d'information par treillis de concepts
National audienceDans cet article nous présentons BR-Explorer, un algorithme de recherche d'information correct et complet qui s'appuie sur la classification par treillis de concepts. L'algorithme BR-Explorer a pour objectif la recherche d'objets pertinents pour une requête donnée. Initialement, nous disposons d'un contexte formel représentant la relation entre un ensemble d'objets décrits par un ensemble d'attributs et du treillis de concepts correspondant à ce contexte. Étant donné une requête, l'algorithme BR-Explorer commence par générer un concept formel représentant la requête puis l'insère dans le treillis de concepts. Ensuite, BR-Explorer localise, dans le treillis résultant, un ``concept pivot'' à partir duquel il construit la réponse à la requête étape par étape en effectuant un parcours en largeur des concepts subsumants le concept pivot jusqu'au concept le plus général du treillis. Finalement BR-Explorer retourne en réponse l'ensemble des objets pertinents ordonnés selon leur degré de pertinence pour la requête
Traitement d'attributs inter-dépendants pour la recherche d'information par treillis
National audienceDans cet article nous étudions la prise en compte des relations entre attributs dans le cadre de la recherche d'information par treillis de concepts. Il s'agit en premier d'étendre l'analyse de concepts formels (FCA) pour gérer les contextes formels où il existe des relations entre les attributs et par la suite d'appliquer cette extension à la recherche d'information par treillis. Les relations entre attributs permettent de distinguer des attributs plus importants et d'autres moins importants ce qui traduit la préférence qu'on pourrait avoir pour un (ensemble d') attribut(s) plutôt que d'autres. La prise en compte de ces relations est particulièrement intéressante pour la recherche d'information par treillis pour deux raisons : d'une part elle permet d'effectuer une exploration guidée par des connaissances d'un treillis de concepts et d'autre part elle permet de préciser la façon dont les motsclés d'une requête doivent être considérés et interprétés afin d'obtenir la réponse la plus satisfaisante
- …