2 research outputs found

    Exploring the reuse of past search results in information retrieval

    Get PDF
    Les recherches passĂ©es constituent pourtant une source d'information utile pour les nouveaux utilisateurs (nouvelles requĂȘtes). En raison de l'absence de collections ad-hoc de RI, Ă  ce jour il y a un faible intĂ©rĂȘt de la communautĂ© RI autour de l'utilisation des recherches passĂ©es. En effet, la plupart des collections de RI existantes sont composĂ©es de requĂȘtes indĂ©pendantes. Ces collections ne sont pas appropriĂ©es pour Ă©valuer les approches fondĂ©es sur les requĂȘtes passĂ©es parce qu'elles ne comportent pas de requĂȘtes similaires ou qu'elles ne fournissent pas de jugements de pertinence. Par consĂ©quent, il n'est pas facile d'Ă©valuer ce type d'approches. En outre, l'Ă©laboration de ces collections est difficile en raison du coĂ»t et du temps Ă©levĂ©s nĂ©cessaires. Une alternative consiste Ă  simuler les collections. Par ailleurs, les documents pertinents de requĂȘtes passĂ©es similaires peuvent ĂȘtre utilisĂ©es pour rĂ©pondre Ă  une nouvelle requĂȘte. De nombreuses contributions ont Ă©tĂ© proposĂ©es portant sur l'utilisation de techniques probabilistes pour amĂ©liorer les rĂ©sultats de recherche. Des solutions simples Ă  mettre en Ɠuvre pour la rĂ©utilisation de rĂ©sultats de recherches peuvent ĂȘtre proposĂ©es au travers d'algorithmes probabilistes. De plus, ce principe peut Ă©galement bĂ©nĂ©ficier d'un clustering des recherches antĂ©rieures selon leurs similaritĂ©s. Ainsi, dans cette thĂšse un cadre pour simuler des collections pour des approches basĂ©es sur les rĂ©sultats de recherche passĂ©es est mis en Ɠuvre et Ă©valuĂ©. Quatre algorithmes probabilistes pour la rĂ©utilisation des rĂ©sultats de recherches passĂ©es sont ensuite proposĂ©s et Ă©valuĂ©s. Enfin, une nouvelle mesure dans un contexte de clustering est proposĂ©e.Past searches provide a useful source of information for new users (new queries). Due to the lack of ad-hoc IR collections, to this date there is a weak interest of the IR community on the use of past search results. Indeed, most of the existing IR collections are composed of independent queries. These collections are not appropriate to evaluate approaches rooted in past queries because they do not gather similar queries due to the lack of relevance judgments. Therefore, there is no easy way to evaluate the convenience of these approaches. In addition, elaborating such collections is difficult due to the cost and time needed. Thus a feasible alternative is to simulate such collections. Besides, relevant documents from similar past queries could be used to answer the new query. This principle could benefit from clustering of past searches according to their similarities. Thus, in this thesis a framework to simulate ad-hoc approaches based on past search results is implemented and evaluated. Four randomized algorithms to improve precision are proposed and evaluated, finally a new measure in the clustering context is proposed
    corecore