14,524 research outputs found

    Evaluación de sistemas de extracción de frases clave.

    Get PDF
    El manejo de información en la actualidad es un factor de gran importancia dentro de los sectores públicos y privados. Con el crecimiento constante de los volúmenes de información electrónica, ésta requiere ser organizada para su uso. Con la tecnología que se cuenta hoy en día, el manejo de la información se ha facilitado. Dentro del área de Procesamiento de Lenguaje Natural una de las disciplinas que la integran es la Recuperación de Información (RI). La RI es el proceso de encontrar en un repositorio grande de datos, material (usualmente documentos) de naturaleza no estructurada (usualmente texto) o semiestructurada (páginas Web) que satisfaga una necesidad de información [Manning 09]. Para lograr la RI, existen varios sistemas, estos reciben el nombre de sistemas de recuperación de información. Un Sistema de Recuperación de Información (SRI) consiste básicamente de un conjunto de procesos interrelacionados que permiten obtener información de interés, a partir de una determinada consulta [Jiménez 03]. Un ejemplo de un SRI es un buscador Web, ya que se ingresa una búsqueda y este devuelve los resultados que han coincidido con el texto de entrada.Hoy en día, la cantidad de información electrónica en forma de texto ha aumentado considerablemente por lo que una búsqueda de información puede traer consigo varios documentos recuperados. Posteriormente, los documentos recuperados se tienen que revisar para saber si contienen lo que realmente se busca. Una manera de simplificar una búsqueda es el empleo de palabras o frases clave ya que actúan como filtro en un campo de búsqueda. Las palabras o frases clave se utilizan en muchas áreas, por ejemplo, la mercadotecnia y publicidad, en donde el objetivo es capturar la atención del público. De igual forma, en todo aquello que se quiere dar a conocer hacia el público en general. Ya sean documentos de textos impresos o electrónicos, las frases clave ayudan al lector mostrándole las ideas principales del texto. En esta tesis, se comparan los sistemas de extracción automática de frases clave sobre un conjunto de artículos científicos utilizados en la tarea 5 del SemEval-2010, con el objetivo de conocer qué sistemas pueden encontrar las frases clave que fueron propuestas por un ser humano. En la experimentación se presentan los resultados de la comparación entre los sistemas instalables y en línea. Por último, los resultados de la evaluación se comparan con los de la tarea 5 del SemEval-2010

    Recuperación de información en la Web Semántica

    Full text link
    Artículo FINALISTA del I Premio NováticaLa búsqueda semántica ha sido una de las motivaciones principales de la Web Semántica desde sus inicios. En este artículo proponemos un modelo para la explotación de bases de conocimiento orientadas a ontologías para mejorar la búsqueda en grandes repositorios documentales. El modelo de recuperación se basa en una adaptación del modelo vectorial clásico, con un método para la asignación de pesos a la anotación semántica de documentos, y un algoritmo de ranking o clasificación. La búsqueda semántica se combina con una búsqueda basada en palabras clave para conseguir una tolerancia a la incompletitud de las bases de conocimiento. Nuestra propuesta se ha probado en corpus de escala significativa, con resultados prometedores respecto de la búsqueda por palabra clave, y abriendo campo para el análisis y la exploración

    La visión artificial, un nuevo aliado para el análisis de imágenes artísticas

    Get PDF
    This paper analyzes the automatic classification of scenes that are the basis of the ideation and the designing of the sculptural production of the sculptor Miquel Planas. The main purpose is to evaluate the performance of the Bag-of-Features methods, in the challenging task of categorizing scenes when scenes differ in semantics rather than the objects they contain. We have employed a kernel-based recognition method that works by computing rough geometric correspondence on a global scale using the pyramid matching scheme introduced by Lazebnik, Schmid and Ponce in 2006. Results are promising, on average the score is about 70%. Experiments suggest that the automatic categorization of images based on computer vision methods can provide objective principles in cataloging images.En este estudio se evalúa el rendimiento de los métodos de Bag-of-Visualterms (BOV) para la clasificación automática de imágenes digitales de la base de datos del artista Miquel Planas. Estas imágenes intervienen en la ideación y diseño de su producción escultórica. Constituye un interesante desafío dada la dificultad de la categorización de escenas cuando éstas difieren más por los contenidos semánticos que por los objetos que contienen. Hemos empleado un método de reconocimiento basado en Kernels introducido por Lazebnik, Schmid y Ponce en 2006. Los resultados son prometedores, en promedio, la puntuación del rendimiento es aproximadamente del 70%. Los experimentos sugieren que la categorización automática de imágenes basada en métodos de visión artificial puede proporcionar principios objetivos en la catalogación de imágenes y que los resultados obtenidos pueden ser aplicados en diferentes campos de la creación artística

    Adopción y uso de sistemas de organización del conocimiento específicos de dominio: análisis y evaluación de factores limitantes

    Get PDF
    Los sistemas de organización del conocimiento (KOS – “Knowledge Organization Systems”) son una herramienta de gran ayuda de cara a la clasificación, organización y localización de información. La construcción de un KOS parte de una serie de términos, cuya selección en la mayor parte de los casos atiende a un dominio específico. Sobre estos términos se establecen distintas relaciones, como podría ser una relación jerárquica o una relación de equivalencia. La forma más elemental de uso de KOS consiste en valerse de los términos que los componen como palabras clave, mientras que las relaciones existentes permiten desarrollar funcionalidades avanzadas empleadas en áreas como la inteligencia artificial o la web semántica, entre otras. Los usuarios pueden beneficiarse de esta información de manera consciente mediante el empleo de interfaces que permiten operar con los términos y relaciones de un KOS, ya sea de manera textual o visual. La investigación relativa al desarrollo de estas interfaces tiene un largo recorrido y múltiples estudios muestran las potenciales ventajas que ofrecen para el usuario final. Sin embargo, a nivel práctico, su uso no está extendido en este sentido, contradiciendo los beneficios que resultan a nivel teórico. El presente trabajo persigue indagar en algunas de las posibles causas de este desuso y contribuir aportando metodologías que permitan evaluar su impacto, proporcionando información de utilidad para modificar un KOS de forma que se potencie su uso

    La Web semántica y las tecnologías del lenguaje humano

    Get PDF
    The implementation of semantic web address the current represents a paradigm shift, as it has to be passed from a web-based and natural language created in a structured and organized web, where content will be semantically labeled the main element. This will represent a new philosophy and way of working, as the development and creation of content for this website require a great deal of effort. This is the point where they can speak human language technologies to provide mechanisms and tools to assist the implementation and expansion of this new paradigm

    Revisión sistemática para las técnicas de minería Web de contenido

    Get PDF
    Trabajo de InvestigaciónDeterminar las principales técnicas empleadas de minería web que permiten realizar minería de contenido, con el fin de facilitar la búsqueda de información en bases documentales. Para ello se llevó a cabo una revisión sistemática de la información documentada en medios arbitrados en el período 2014 – 2018, empleando las bases documentales Redalyc, Scielo, Scopus, IEEEXplore, Google Scholar y Web of ScienceINTRODUCCIÓN 1. GENERALIDADES 2. DEFINICIÓN DE LOS CRITERIOS DE BÚSQUEDA DE ARTÍCULOS SOBRE MINERÍA DE CONTENIDO EN LA WEB 3. IDENTIFICACIÓN DE LAS TÉCNICAS QUE HAN SIDO EMPLEADAS PARA REALIZAR MINERÍA DE CONTENIDO EN LA WEB 4. CARACTERIZACIÓN DE LAS PRINCIPALES TÉCNICAS QUE HAN SIDO EMPLEADAS PARA REALIZAR MINERÍA DE CONTENIDO EN LA WEB 5. CONCLUSIONES 6. RECOMENDACIONES BIBLIOGRAFÍA ANEXOSPregradoIngeniero de Sistema

    Web semántica : un nuevo enfoque para la organización y recuperación de información en el web

    Get PDF
    A theoretical and conceptual approach to the development of the information organization and retrieval is made in an automatic environment by means of the automatic indexing and classification of the information as processes prior to information retrieval. The evolution experienced by the systems of organization of information and knowledge is analysed by taxonomies, thesaurus and Topic Maps toward more complex structures, such as ontologies. Some metadata schemes created for the description of the information in the web, as well as the components and technologies that integrate the theoretical model of the web semantics, are examined. Finally, the constructive stratum model that will guarantee the functioning of its entire infrastructure is explained

    Primeras aproximaciones a la anotación lingüístico-ontológica de documentos de Web Semántica: OntoTag

    Full text link
    A instancias de lo que se ha dado en llamar la Web Semántica, la Inteligencia Artificial ha investigado exhaustivamente la anotación semántica de páginas web. La anotación (semántica) de textos se desarrolló primeramente en la Lingüística de Corpus; sin embargo, la Inteligencia Artificial, al centrarse en una anotación basada en ontologías, parece haber pasado por alto sus resultados. Este artículo muestra nuestras primeras experiencias en la integración de ambos campos, según las cuales una anotación híbrida (lingüística y ontológica) no sólo sería posible, sino también de gran utilidad, para hacer más comprensibles a un ordenador los documentos de la Web Semántica. Nuestro equipo de investigación está desarrollando OntoTag, un modelo de anotación multi-nivel (en principio, también multilingüe y de propósito general) basado en los estándares EAGLES y en la Semántica Ontológica, e implementado en lenguajes de marcado de última generación (RDF(S)/XML)

    Hipervinculación de documentos con Máquinas de Soporte Vectorial

    Get PDF
    En la actualidad el acceso a la información se da por medio de hipervínculos, los cuales interconectan los textos entre si únicamente si contienen una relación. Varios investigadores han estudiado la forma en que los humanos crean los hipervínculos y han tratado de replicar el modo de trabajo específicamente de la colección de Wikipedia. El uso de hipervínculos se ha pensado como un prometedor recurso para la recuperación de información, que fue inspirado por el análisis de citas de la literatura (Merlino-Santesteban, 2003). Según Dreyfus (Dreyfus, 2003) la hipervinculación no tiene ningún criterio específico, ni tampoco jerarquías. Por ello cuando todo puede vincularse indiscriminadamente y sin obedecer un propósito o significado en particular, el tamaño de la red y la arbitrariedad entre sus hipervínculos, hacen extremadamente difícil para un usuario encontrar exactamente el tipo de información que busca. En las organizaciones, la familiaridad y la confianza durante mucho tiempo han sido identificadas como las dimensiones de credibilidad de la fuente de información en publicidad (Eric Haley, 1996). Un hipervínculo, como una forma de información, puede, por lo tanto, tener un mayor impacto cuando se presenta por un objetivo conocido (Stewart & Zhang, 2003). Mientras tanto, los hipervínculos entre los sitios web pueden generan confianza en el remitente y el receptor del enlace, por lo que estas interacciones tienen efectos positivos de reputación para el destinatario (Stewart, 2006) (Lee, Lee, & Hwang, 2014). El estudio de documentos por medio de los hipervínculos es un área importante de investigación en minería de datos, en una red social a menudo lleva una gran cantidad de información estructural formada por los hipervínculos creando nodos compartidos dentro de la comunidad. Algunas importantes aplicaciones de los métodos de minería de datos para redes sociales son la recomendación social mediante las experiencias similares de los usuarios (Alhajj & Rokne, 2014). En marketing y publicidad se aprovechan las cascadas en las redes sociales y se obtienen beneficios sobre modelos de propagación de la información (Domingos & Richardson, 2001). Las empresas de publicidad están interesados en cuantificar el valor de un solo nodo en la red, tomando en cuenta que sus acciones pueden desencadenar cascadas a sus nodos vecinos. Los resultados de (Allan, 1997) (Bellot et al., 2013) (Agosti, Crestani, & Melucci, 1997) (Blustein, Webber, & Tague-Sutcliffe, 1997) sugieren que el descubrimiento de hipervínculos automatizado no es un problema resuelto y que cualquier evaluación de los sistemas de descubrimiento de Hipervínculos de Wikipedia debe basarse en la evaluación manual, no en los hipervínculos existentes
    corecore