5 research outputs found

    Site-based dynamic pruning for query processing in search engines

    Get PDF
    Web search engines typically index and retrieve at the page level. In this study, we investigate a dynamic pruning strategy that allows the query processor to first determine the most promising websites and then proceed with the similarity computations for those pages only within these sites

    Pruning Statico di Posting a Basso Impatto su Indici per Sistemi di Information Retrieval

    Get PDF
    Il web mette a disposizione una vastissima collezione di documenti che i motori di ricerca devono accedere per fornire risultati alle richieste degli utenti. Al fine di rispondere in modo efficiente ad ogni richiesta, i motori di ricerca usano strutture dati chiamate indici, che sintetizzano l'informazione contenuta all'interno della collezione di documenti. La dimensione degli indici cresce al crescere del quantitativo di informazione da memorizzare e, con questa, cresce anche il tempo necessario per il recupero dell'informazione. L'obiettivo di questa tesi è quindi quello di proporre una strategia per l'eliminazione di informazione ritenuta non utile dall'indice, riducendone notevolmente la dimensione e quindi il tempo necessario per accedervi, preservando la qualità dei risultati dell'indice originale

    Site-based dynamic pruning for query processing in search engines

    No full text
    Web search engines typically index and retrieve at the page level. In this study, we investigate a dynamic pruning strategy that allows the query processor to first determine the most promising websites and then proceed with the similarity computations for those pages only within these sites