9 research outputs found

    Noise-tolerance feasibility for restricted-domain Information Retrieval systems

    Get PDF
    Information Retrieval systems normally have to work with rather heterogeneous sources, such as Web sites or documents from Optical Character Recognition tools. The correct conversion of these sources into flat text files is not a trivial task since noise may easily be introduced as a result of spelling or typeset errors. Interestingly, this is not a great drawback when the size of the corpus is sufficiently large, since redundancy helps to overcome noise problems. However, noise becomes a serious problem in restricted-domain Information Retrieval specially when the corpus is small and has little or no redundancy. This paper devises an approach which adds noise-tolerance to Information Retrieval systems. A set of experiments carried out in the agricultural domain proves the effectiveness of the approach presented

    Enriqueciendo la integración de recursos semánticos basados en WordNet

    Get PDF
    In this paper we present the enrichment of the Integration of Semantic Resources based in WordNet (ISR-WN Enriched). This new proposal improves the previous one where several semantic resources such as SUMO, WordNet Domains and WordNet Affects were related, adding other semantic resources such as Semantic Classes and SentiWordNet. Firstly, the paper describes the architecture of this proposal explaining the particularities of each integrated resource. After that, we analyze some problems related to the mappings of different versions and how we solve them. Moreover, we show the advantages that this kind of tool can provide to different applications of Natural Language Processing. Related to that question, we can demonstrate that the integration of semantic resources allows acquiring a multidimensional vision in the analysis of natural language.En este artículo se presenta el enriquecimiento de la herramienta Integración de recursos Semánticos basados en WordNet (ISR-WN Enriquecido). Esta nueva propuesta mejora la anterior, introduciendo nuevos recursos tales como Semantic Classes y SentiWordNet a los anteriormente relacionados: SUMO, WordNet Domains y WordNet Affects. Previamente a la introducción de nuevos recursos se describe la arquitectura de esta propuesta explicando las particularidades de cada recurso integrado. Tras la descripción de la arquitectura se analizan los problemas surgidos tras el mapeo de diferentes versiones y cómo se han solucionado. Además, se muestran las ventajas que la introducción de este tipo de herramientas pueden proporcionar a diferentes aplicaciones de Procesamiento del Lenguaje Natural. Relacionado con esta cuestión también se demuestra que la integración de recursos semánticos permite adquirir una visión multidimensional en el análisis del lenguaje natural.This paper has been supported partially by Ministerio de Ciencia e Innovación - Spanish Government (grant no. TIN2009-13391-C04-01), and Conselleria d'Educació - Generalitat Valenciana (grant no. PROMETEO/2009/119, ACOMP/2010/288 and ACOMP/2011/001)

    Integration of semantic resources based on WordNet

    Get PDF
    Este artículo presenta una herramienta para integrar diferentes recursos basados en la estructura y relaciones internas de WordNet, utilizando técnicas de grafos. El objetivo es centralizar en una única herramienta el acceso y manejo de interrelaciones entre diferentes recursos tales como: WordNet Domains, Wordnet Affect y SUMO. Como resultado de la integración, se ha obtenido una única interfaz capaz de relacionar los diferentes sentidos de una palabra con sus correspondientes dominios, categorías de SUMO o relaciones de WordNet. Tras el proceso de integración se han realizado una serie de pruebas para comprobar el grado de fiabilidad de la herramienta.This paper presents a new tool to integrate different resources based on the WordNet structure and relations, using algorithm and graph techniques. The main goal is to provide in a unique tool access and management of relations among different resources like: WordNet Domains, WordNet Affect and SUMO. As a result, we have obtained a unique interface to relate different senses of one word with their corresponding domains, SUMO categories or WordNet relations. After the process of integration we have conducted several experiments to test the reliability of this tool.Este artículo ha sido cofinanciado por el Ministerio de Ciencia e Innovación (proyecto TIN2009-13391-C04-01), y la Conselleria d'Educación de la Generalitat Valenciana (proyectos PROMETEO/2009/119 y ACOMP/2010/288)