15 research outputs found

    Un modèle de RI basé sur des critères d'obligation et de certitude

    No full text
    International audienceIl existe un grand nombre de modèles de recherche d'information chacun ayant pour but de répondre au mieux aux attentes des utilisateurs. Le modèle que nous proposons se base sur une formulation précise de la requête reflétant le besoin de l'utilisateur : Chaque terme de la requête est augmenté par deux critères, l'un exprimant l'obligation ou non de l'apparition du terme dans les documents et l'autre exprimant la certitude de l'utilisateur quand au terme utilisé. Des expérimentations nous ont permis de vérifier qu'une telle formulation permet de gagner en précision

    Modèle d'indexation de données peu symboliques dans des documents structurés : L'exemple du graphique dans un corpus de documents techniques

    No full text
    International audienceCet article s'intéresse à l'indexation des données ayant une sémantique pauvre dans des documents structurés. Le but est d'exploiter le contenu des données symboliques avoisinantes afin d'en extraire les fragments adéquats pour compléter l'indexation de la donnée non symbolique. Cette approche a été abordée dans le cadre concret d'une application dans un contexte professionnel : indexer les graphiques des documents techniques en exploitant le texte qui les accompagne. Cette indexation est articulée autour d'un modèle de représentation des graphiques tenant compte de la finalité de leur utilisation et du professionnalisme de leurs usagers, et d'un modèle d'extraction des termes d'indexation à partir du texte du document technique

    Querying the Semantic Web of Data using SPARQL, RDF and XML

    Get PDF
    The Semantic Web relies on two layers: XML and RDF. XML documents are merely trees representing structured data or documents and accessed using XPath. RDF is used for a Web of data and to provide metadata about data or documents; it is organized as graphs made of collections of elementary triples and can be queried using SPARQL. Based on these two paradigms, there exist tools and platforms that produce and process both XML and RDF. When doing information integration and mash-up applications, there are scenarios where we need to query, compare and integrate data coming from both worlds. In this report we present a seamless way of mixing both paradigms in SPARQL. Generic extensions to SPARQL are explained, and then we provide use cases and an application in semantic annotation of textual documents using NLP techniques

    Modèle d'indexation des graphiques des documents techniques

    No full text
    Le document a subi de nombreuses mutations au cours du temps. Sa maniabilité, son contenu, son support ainsi que son utilisation l'ont fait passer de la peinture rupestre au document électronique tel que nous le connaissons aujourd'hui. Durant cette évolution, les illustrations ont toujours été présentes et occupent dorénavant une place importante dans les modes de communication au sein de notre société. Plus particulièrement, dans les documents techniques, la coexistence du texte et des illustrations est omniprésente. Les illustrations dans ces documents sont particulières puisqu'il s'agit de graphiques. L'information véhiculée dans les documents techniques est présente dans les deux modes d'expressions que sont le texte et le graphique et notamment entre le graphique et son commentaire. Une complémentarité informationnelle entre ces deux médias existe mutuellement dans ces documents, et il est donc nécessaire de donner au document une " intégrité sémantique", en utilisant aussi bien les graphiques que le texte. On peut cependant noter que généralement la plupart des systèmes délaissent les graphiques au profil du texte. Si de nombreux travaux sur l'indexation d'images ou de graphiques existent, très peu de recherche s'est concentrée sur le complément informatif graphique-texte. Notre objectif est d'exploiter cette complémentarité informationnelle dans les documents techniques, afin d'aboutir à un modèle de représentation des graphiques tenant compte de leurs propriétés ainsi que du contexte textuel dans lequel ils apparaissent. Nous souhaitons ainsi parvenir à un processus d'indexation semi-automatique des graphiques contenus dans les documents techniques par des termes appropriés extraits du texte les décrivant

    Un modèle général de recherche d?information :<br>Application à la recherche de documents techniques par des professionnels

    No full text
    In the information retrieval (IR) task, characteristics related to the context of the user search induce some needs it is necessary to take into account in the modeling of the IR system. In this work we consider that the user has a memory about the documents he wants to find: his need consists of a description of the ideal document w.r.t his memory of the content of these documents. In the aim to tackle this need, we propose an information retrieval model based on (i) a complex language (inter-connected entities with multiple use of the same entity to describe the document and the user query), (ii) additional criteria on query terms, focusing on obligation/optionality, and certainty/uncertainty, in order to express user doubts and its vague needs, and (iii) a matching function which takes into account constraints related to the document/query representation, as well as a query reformulation approach based on characteristics of documents that are considered relevant by the user. This model is applied thereafter within a concrete application: graphics retrieval by professionals in technical documentation. Through this application, we compare our model with classical IR models in order to validate our approach (e.g. obligation/optionality, and certainty/uncertainty criteria).En recherche d'information, les particularités relatives au contexte de recherche de l'utilisateur induisent certains besoins qu'il est nécessaire de prendre en compte dans la modélisation du système de recherche. Dans notre travail de thèse, nous nous situons dans un contexte où l'utilisateur a une mémoire des documents qu'il désire retrouver : son besoin est alors une description d'un document idéal, reflet du souvenir qu'il a de ces documents. Dans ce contexte de recherche particulier, nous proposons un modèle de recherche d'information fondé sur (i) un langage complexe (des entités inter reliées avec utilisation multiple d'une même entité dans la description du document et du besoin), (ii) des critères d'obligation/option et de certitude/incertitude, rattachés aux éléments de la requête, qui reflètent les doutes de l'utilisateur quant au contenu des documents susceptibles de l'intéresser et (iii) une fonction de correspondance prenant en compte les contraintes liées à la représentation des documents et des requêtes ainsi qu'une approche pour la reformulation du besoin fondée sur les jugements de pertinence de l'utilisateur et sur les caractéristiques communes des documents retenus (par rapport aux critères rattachés à la requête). Ce modèle est par la suite appliqué dans le cadre concret d'une application : la recherche de graphiques dans les documents techniques par des utilisateurs professionnels. À travers cette application, nous validons notre approche (prise en compte des critères d'obligation/option et de certitude/incertitude) en comparant notre modèle aux modèles classiques existants
    corecore