4 research outputs found

    La prĂ©diction efficace de la difficultĂ© des requĂȘtes : une tĂąche impossible?

    Get PDF
    National audienceABSTRACT. Search engines found answers whatever the user query is, but some queries are more difficult than others for the system. For difficult queries, adhoc treatments must be applied. Predicting query difficulty is crucial and different predictors have been proposed. In this paper, we revisit these predictors. First we check the non statistical redundancy of predictors. Then, we show that the correlation between the values of predictors and system performance gives little hope on the ability of these predictors to be effective. Finally, we study the ability of predictors to predict the classes of difficulty by relying on a variety of exploratory and learning methods. We show that despite the (low) correlation with performance measures, current predictors are not robust enough to be used in practical IR applications. MOTS-CLÉS : Recherche d'information, requĂȘte difficile, prĂ©diction, analyse de donnĂ©es.RÉSUMÉ. Les moteurs de recherche d'information (RI) retrouvent des rĂ©ponses quelle que soit la requĂȘte, mais certaines requĂȘtes sont difficiles (le systĂšme n'obtient pas de bonne performance en termes de mesure de RI). Pour les requĂȘtes difficiles, des traitements adhoc doivent ĂȘtre ap-pliquĂ©s. PrĂ©dire qu'une requĂȘte est difficile est donc crucial et diffĂ©rents prĂ©dicteurs ont Ă©tĂ© proposĂ©s. Dans cet articlenous Ă©tudions la variĂ©tĂ© de l'information captĂ©e par les prĂ©dicteurs existants et donc leur non redondance. Par ailleurs, nous montrons que les corrĂ©lationsentre les prĂ©dicteurs et les performance des systĂšmes donnent peu d'espoir sur la capacitĂ© de ces prĂ©dic-teurs Ă  ĂȘtre rĂ©ellement efficaces. Enfin, nous Ă©tudions la capacitĂ© des prĂ©dicteurs Ă  prĂ©dire les classes de difficultĂ© des requĂȘtes en nous appuyant sur une variĂ©tĂ© de mĂ©thodes exploratoires et d'apprentissage. Nous montrons que malgrĂ© les (faibles) corrĂ©lations observĂ©es avec les mesures de performance, les prĂ©dicteurs actuels conduisent Ă  des performances de prĂ©diction variables et sont donc difficilement utilisables dans une application concrĂšte de RI

    Combining Word Embedding Interactions and LETOR Feature Evidences for Supervised QPP

    Get PDF
    In information retrieval, query performance prediction aims to predict whether a search engine is likely to succeed in retrieving potentially relevant documents to a user’s query. This problem is usually cast into a regression problem where a machine should predict the effectiveness (in terms of an information retrieval measure) of the search engine on a given query. The solutions range from simple unsupervised approaches where a single source of information (e.g., the variance of the retrieval similarity scores in NQC), predicts the search engine effectiveness for a given query, to more involved ones that rely on supervised machine learning making use of several sources of information, e.g., the learning to rank (LETOR) features, word embedding similarities etc. In this paper, we investigate the combination of two different types of evidences into a single neural network model. While our first source of information corresponds to the semantic interaction between the terms in queries and their top-retrieved documents, our second source of information corresponds to that of LETOR features

    La prĂ©diction efficace de la difficultĂ© des requĂȘtes : une tĂąche impossible? (prĂ©sentation courte)

    Get PDF
    Les moteurs de recherche d’information (RI) retrouvent des rĂ©ponses quelle que soit la requĂȘte, mais certaines requĂȘtes sont difficiles (le systĂšme n’obtient pas de bonne performance en termes de mesure de RI). Pour les requĂȘtes difficiles, des traitements adhoc doivent ĂȘtre appliquĂ©s. PrĂ©dire qu’une requĂȘte est difficile est donc crucial et diffĂ©rents prĂ©dicteurs ont Ă©tĂ© proposĂ©s. Dans cet articlenous Ă©tudions la variĂ©tĂ© de l’information captĂ©e par les prĂ©dicteurs existants et donc leur non redondance. Par ailleurs, nous montrons que les corrĂ©lationsentre les prĂ©dicteurs et les performance des systĂšmes donnent peu d’espoir sur la capacitĂ© de ces prĂ©dicteurs Ă  ĂȘtre rĂ©ellement efficaces. Enfin, nous Ă©tudions la capacitĂ© des prĂ©dicteurs Ă  prĂ©dire les classes de difficultĂ© des requĂȘtes en nous appuyant sur une variĂ©tĂ© de mĂ©thodes exploratoires et d’apprentissage. Nous montrons que malgrĂ© les (faibles) corrĂ©lations observĂ©es avec les mesures de performance, les prĂ©dicteurs actuels conduisent Ă  des performances de prĂ©diction variables et sont donc difficilement utilisables dans une application concrĂšte de RI
    corecore