90 research outputs found
Un modèle de RI basé sur des critères d'obligation et de certitude
International audienceIl existe un grand nombre de modèles de recherche d'information chacun ayant pour but de répondre au mieux aux attentes des utilisateurs. Le modèle que nous proposons se base sur une formulation précise de la requête reflétant le besoin de l'utilisateur : Chaque terme de la requête est augmenté par deux critères, l'un exprimant l'obligation ou non de l'apparition du terme dans les documents et l'autre exprimant la certitude de l'utilisateur quand au terme utilisé. Des expérimentations nous ont permis de vérifier qu'une telle formulation permet de gagner en précision
Modèle d'indexation de données peu symboliques dans des documents structurés : L'exemple du graphique dans un corpus de documents techniques
International audienceCet article s'intéresse à l'indexation des données ayant une sémantique pauvre dans des documents structurés. Le but est d'exploiter le contenu des données symboliques avoisinantes afin d'en extraire les fragments adéquats pour compléter l'indexation de la donnée non symbolique. Cette approche a été abordée dans le cadre concret d'une application dans un contexte professionnel : indexer les graphiques des documents techniques en exploitant le texte qui les accompagne. Cette indexation est articulée autour d'un modèle de représentation des graphiques tenant compte de la finalité de leur utilisation et du professionnalisme de leurs usagers, et d'un modèle d'extraction des termes d'indexation à partir du texte du document technique
Une Analyse préalable à l'indexation de transcriptions de conversations téléphoniques
International audienceNous nous intéressons dans cet article au problème de l'indexation de documents audio de type " conversation téléphonique ". Nous nous interrogeons en particulier sur le bien fondé de l'utilisation, pour ce type de documents, des méthodes d'indexation classiquement utilisées en recherche d'information textuelle. Pour répondre à ces questions, nous revisitons certaines hypothèses de la recherche d'information en étudiant la spécificité et l'applicabilité de ces hypothèses à des transcriptions de conversations téléphoniques. Nos observations nous conduisent à proposer les bases d'un système d'indexation pour ce type de documents qui comprend un module de découpage thématique de la conversation
Cartes de communautés pour l'adaptation interactive de profils dans un système de filtrage d'information
National audienceDans le contexte actuel de surcharge d'informations, les utilisateurs peuvent s'en remettre à des systèmes de filtrage qui leur recommandent en permanence, en se basant sur leur profil, des informations vraisemblablement pertinentes. Néanmoins, un changement dans leur besoin d'information n'est pas toujours bien pris en compte à cause du rôle relativement passif des utilisateurs dans la plupart des systèmes existants. Nous présentons dans cet article la possibilité d'utilisation interactive de " cartes de communautés " pour cette tâche d'adaptation des profils, dans la perspective à plus long terme d'enrichir l'interaction entre utilisateurs et système de filtrage. Nous adoptons un processus de formation des communautés d'utilisateurs qui exploite un algorithme de positionnement en 2 dimensions et un algorithme classique de classification non supervisée afin d'obtenir de véritables " cartes " des communautés. Ces cartes s'appuient sur deux critères différents de formation des communautés
Exploitation des données "disponibles à froid" pour améliorer le démarrage à froid dans les systèmes de filtrage d'information
International audienceDans les systèmes de filtrage d'information, les utilisateurs reçoivent des documents que leur recommande le système sur la base de leurs profils et/ou de leurs communautés, mais le problème du " démarrage à froid " conduit à des performances très pauvres pour les nouveaux utilisateurs. Nous améliorons ici les techniques classiques de démarrage à froid en exploitant les données " disponibles à froid " (par exemple âge, profession, lieu de résidence, etc.) afin d'associer automatiquement les meilleures communautés initiales aux nouveaux utilisateurs. Nous nous appuyons sur le modèle existant des " espaces de communautés ", et nous utilisons un processus de classification par règles et définissons un processus de recommandations par niveau d'accord. L'évaluation montre que cette approche fournit des recommandations meilleures que celles obtenues suite à un processus de démarrage à froid classique
A New Lattice-Based Information Retrieval Theory
Logic-based Information Retrieval (IR) models represent the retrieval decision as an implication d → q between a document d and a query q, where d and q are logical sentences. However, d → q is a bi- nary decision, we thus need a measure to estimate the degree to which d implies q, noted P(d → q). The main problems in the logic-based IR models are the difficulties to implement the decision algorithms and to define the uncertainty measure P as a part of the logic. In this study, we chose the Propositional Logic (PL) as the underlying framework. We propose to replace the implication d → q by the material implication d ⊃ q. However, we know that there is a mapping between PL and the lattice theory. In addition, Knuth [13] introduced the notion of degree of inclusion to quantify the ordering relations defined on lattices. There- fore, we position documents and queries on a lattice, where the ordering relation is equivalent to the material implication. In this case, the impli- cation d → q is replaced by an ordering relation between documents and queries, and the uncertainty P(d → q) is redefined using the degree of inclusion measure. This new IR model is: 1- general where it is possible to instantiate most of classical IR models depending on our lattice-based model, 2- capable to formally prove the intuition of Rijsbergen about replacing P (d → q) by P (q|d), and 3- easy to implement
Image retrieval : a first step for a human centered approach
International audienceImage indexing using content analysis is known as a difficult task, involving the vision research domain. Using these tools in the context of a retrieval system is generally frustrating for users, due to a lack of interfaces development, and to the difficulty for users to understand the low-level features managed by the system. We propose in this paper a general point of view for introducing a link between such systems and potential users. This includes image features based on visual perception models, a relevance feedback model, and a graphical interface to express the information need through user-system interaction
Implementation and analysis of several keyframe-based browsing interfaces to digital video
In this paper we present a variety of browsing interfaces for digital video information. The six interfaces are implemented on top of Físchlár, an operational recording, indexing, browsing and playback system for broadcast TV programmes. In developing the six browsing interfaces, we have been informed by the various dimensions which can be used to distinguish one interface from another. For this we include layeredness (the number of “layers” of abstraction which can be used in browsing a programme), the provision or omission of temporal information (varying from full timestamp information to nothing at all on time) and visualisation of spatial vs. temporal aspects of the video. After introducing and defining these dimensions we then locate some common browsing interfaces from the literature in this 3-dimensional “space” and then we locate our own six interfaces in this same space. We then present an outline of the interfaces and include some user feedback
Modèle d'espaces de communautés basé sur la théorie des ensembles d'approximation dans un système de filtrage hybride
International audienceLes systèmes de filtrage ont pour but de distribuer des informations de façon personnalisée aux utilisateurs, tout en s'adaptant en permanence au besoin en information de chacun. Dans un système de filtrage hybride s'appuyant sur le filtrage collaboratif, la production de recommandations se base sur des communautés d'utilisateurs qui sont généralement formées conformément au seul critère de proximité des évaluations des utilisateurs sur les recommandations reçues dans le passé. De plus ces communautés restent généralement implicites. Nous proposons un modèle d'espaces de communautés multicritères et explicites, et des mesures se basant sur la théorie des ensembles d'approximation pour analyser la dépendance entre les critères de formation des communautés. Le modèle d'espaces de communautés permet de diversifier les recommandations qui peuvent émaner de communautés variées. Les mesures permettent de comparer des critères entre eux afin de déterminer une priorité entre les critères dans la tâche d'amélioration du positionnement des utilisateurs dans les communautés
- …