1 research outputs found

    Utilizaci贸n de pasajes de tama帽o variable, para mejorar el proceso de recuperaci贸n de informaci贸n

    No full text
    Trabajos previos demuestran que la utilizaci贸n de fragmentos de documentos como unidad b谩sica de informaci贸n, para calcular la relevancia de un documento con respecto a una pregunta, mejora sensiblemente los resultados de los sistemas de recuperaci贸n de informaci贸n. Sin embargo, no se ha llegado a un consenso acerca de c贸mo definir esos fragmentos de texto (o p谩rrafos) de forma que el sistema alcance un comportamiento 贸ptimo. El presente art铆culo presenta un sistema de recuperaci贸n de informaci贸n, basado en la definici贸n de pasajes de tama帽o variable. Cada pasaje est谩 formado por un n煤mero determinado de las frases que forman el documento. El n煤mero de frases seleccionadas para cada pasaje depender谩 de la localizaci贸n de las palabras de la pregunta en cada documento. La evaluaci贸n realizada permite comparar el rendimiento de este modelo con un sistema est谩ndar de recuperaci贸n de documentos, as铆 como con otras propuestas que utilizan diferentes m茅todos de definici贸n de pasajes.Previous works show that the use of fragments of documents as the basic unit of information to calculate the relevance of a document with regard to a query, improves the results of information retrieval systems. However, it has not been agreed how these fragments of texts should be obtained in order to obtain optimum results. This paper presents an information retrieval system that is based on the definition of passages of variable size. Each passage is formed by a number of sentences that formed the document. The number of sentences by each passage will depend on the position of the query words in each document. The accomplished evaluation allows comparing the performance of this model with a standard information retrieval system, as well as with other passage retrieval systems.Este art铆culo ha sido financiado parcialmente por el Gobierno Espa帽ol (CICyT) dentro del proyecto n煤mero TIC2000-0664-C02-02 y TIC2001-3530-C02-02
    corecore