30 research outputs found

    IRIT, GeoComp, and LIUPPA at the TREC 2013 Contextual Suggestion Track

    Get PDF
    International audienceIn this paper we give an overview of the participation of the IRIT, GeoComp, and LIUPPA labs in the TREC 2013 Contextual Suggestion Track. Our framework combines existing geo-tools or services (e.g., Google Places, Yahoo! BOSS Geo Services, PostGIS, Gisgraphy, GeoNames) and ranks results according to features such as context-place distance, place popularity, and user preferences. We participated in the Open Web and ClueWeb12 sub-tracks with runs IRIT.OpenWeb and IRIT.ClueWeb

    Indexation spatiale et temporelle baséee sur un principe de "tuilage" : contribution à la recherche d'information géographique dans des documents textuels faiblement structurés

    Get PDF
    International audienceLa plupart des moteurs de recherche nécessitent, pour fonctionner, une indexation préalable des documents. Certaines de ces approches sont limitées compte tenu de contextes particuliers ou de la forme particulière de l'information recherchée. Notre contribution porte sur la construction d'index adaptés à la facette spatiale et temporelle spécifique au contexte de l'information géographique tout en permettant une compatibilité avec les outils de recherche génériques. Ce travail présente une stratégie générique d'indexation basée sur le principe du " tuilage ". Elle s'applique aussi bien sur la composante spatiale que temporelle mais peut également être utilisée sur la composante thématique. Nous évaluons ensuite l'apport de cette approche à la recherche d'information géographique

    Normalizing Spatial Information to Better Combine Criteria in Geographical Information Retrieval

    Get PDF
    International audienceIt is generally accepted that geographical information or G.I. (such as texts, maps and tables) is chiefly composed of 3 kinds of criteria : spatial, temporal and thematic criteria. The main focus of this article is spatial criteria. More specifically, we have developed a processing sequence that can extract the spatial information contained in non-structured cultural heritage texts. This processing sequence indexes spatial information, which enables information retrieval (I.R.) based on the same criteria. Our goal is to normalize heterogeneous spatial information. This normalization is carried out at the index level by grouping spatial information together and by using statistics to calculate weights of spatial areas and the pertinence of the results. Thus, we aim to develop a general IR strategy that is dedicated to spatial information, but which can be applied to temporal and thematic information as well. By generalizing this approach, homogeneous IR strategies will be able to combine spatial, temporal and thematic criteria for more efficient geographic IR methods

    Combinaison de critères par contraintes pour la Recherche d'Information Géographique

    No full text
    Recent studies show an increasing proportion of queries with geographic criteria on Web search engines. This part is even bigger on specific corpora like cultural heritage collection (e.g. travelogues). We admit that the geographic information is composed of three facets: spatial, temporal and thematic. Works realized in our laboratory aim geographic information extraction from textual documents and the construction of independent and specific indexes for theses three facets. The goal of this thesis is to combine these three facets to support multicriteria searches. This work concerns several fields: Natural Language Processing (NLP), Geographic Information System (GIS), classic Information Retrieval (IR) and Geographic Information Retrieval (GIR). Our first contribution is about an original combination approach of specific indexes. During the retrieval process, it consists first in querying the different indexes independently and then combining the results lists. We propose also a user to personalize this combination with constraints. In order to realize this combination, we propose to imitate the homogenization approaches used in classical IR strategies that represent terms with corresponding lemmas. For geographic information, it consists in segmenting them on tiles and on using their occurrence frequency. So, our second contribution concerns a generic standardization approach implemented on spatial and temporal information. In order to evaluate these different propositions, we have tested and validated them via several prototypes and experimentations. The last contribution relates to an evaluation framework for GIR systems. Thanks to this framework, we verified and quantified the benefit of combining the different geographic information facets and also have compared several combination approaches.Des études récentes montrent une part croissante de requêtes sur les moteurs de recherche du Web comportant des critères géographiques. Cette part est encore plus conséquente sur des corpus plus spécifiques tels que des documents patrimoniaux (récits de voyages par exemple). On admet que l'information géographique est composée de trois facettes : le spatial, le temporel et le thématique. Les travaux effectués dans notre laboratoire visent l'extraction et la construction d'index indépendants et spécifiques aux trois facettes (spatiales, temporelles et thématiques). L'objet de ce travail de thèse est de combiner les trois facettes pour effectuer des recherches multicritère. Ce travail s'intègre au croisement de plusieurs disciplines : Traitement Automatique des Langages Naturels (TALN), Systèmes d'Information Géographique (SIG), Recherche d'Information classique (RI) et Recherche d'Information Géographique (RIG). Notre première contribution porte sur une méthode originale de combinaison des index spécifiques. Lors de l'interrogation il s'agit de questionner de manières indépendantes les différents index puis de combiner les listes de résultats restitués lors de leur interrogation. De plus, nous proposons à un utilisateur de personnaliser cette combinaison par des contraintes. Pour pouvoir effectuer cette combinaison, nous proposons d'imiter les approches d'homogénéisation utilisées dans les stratégies de RI classiques portant sur des termes et les lemmes correspondants. Pour les informations géographiques il s'agit de les redécouper en tuiles et de travailler sur leur fréquence d'apparition. Notre deuxième contribution porte sur une approche d'uniformisation générique mise en œuvre sur l'information spatiale et l'information temporelle. Afin d'évaluer ces différentes propositions, nous les avons testées et validées via différents prototypes et expérimentations. La dernière contribution consiste en un cadre d'évaluation d'un système de recherche géographique. Grâce à ce cadre nous avons pu vérifier et quantifier l'apport de la combinaison de critères géographiques ainsi que comparer différentes approches de combinaisons

    Indexation multi-critères et différentes approches de combinaison

    No full text
    National audienceCe papier s'inscrit dans la continuité de travaux sur l'indexation et la recherche d'information menés au LIUPPA sur des critères géographiques. L'information géographique a trois composantes : le spatial, le temporel et le thématique. Notre équipe a déjà travaillé sur le spatial et le temporel de façon indépendante. Aujourd'hui nous cherchons à combiner ces différentes composantes. Pour cela nous proposons d'utiliser une approche statistique, réservée habituellement à l'analyse plein-texte d'un document, pour le spatial et le temporel. Cette approche sera qualifiée de "carroyage". Toutefois nous cherchons aussi à extraire les liens sémantiques existants entre les informations géographiques. Pour cela nous étudions un autre type de combinaison, qualifiée "d'approche par motifs"

    Creating test collections from user generated content for GIR evaluation

    Full text link
    Evaluation of the effectiveness of Geographic Information Retrieval (GIR) systems is challenging and time consuming. We describe an approach to such evaluations, where we use user generated content in the form of text and associated metadata to build a large test colletion automatically. We can thus show that the UGC test collection is useful for evaluating and exploring some of the critical aspects of a GIR, for instance by submitting large numbers of queries

    Indexation Spatiale et Temporelle Basée Sur Un Principe de "Tuilage" : Contribution à La Recherche d'information Géographique Dans Des Documents Textuels Faiblement Structurés

    No full text
    International audienceLa plupart des moteurs de recherche nécessitent, pour fonctionner, une indexation préalable des documents. Certaines de ces approches sont limitées compte tenu de contextes particuliers ou de la forme particulière de l'information recherchée. Notre contribution porte sur la construction d'index adaptés à la facette spatiale et temporelle spécifique au contexte de l'information géographique tout en permettant une compatibilité avec les outils de recherche génériques. Ce travail présente une stratégie générique d'indexation basée sur le principe du " tuilage ". Elle s'applique aussi bien sur la composante spatiale que temporelle mais peut également être utilisée sur la composante thématique. Nous évaluons ensuite l'apport de cette approche à la recherche d'information géographique
    corecore