8 research outputs found

    Pattern Matching and Discourse Processing in Information Extraction from Japanese Text

    Full text link
    Information extraction is the task of automatically picking up information of interest from an unconstrained text. Information of interest is usually extracted in two steps. First, sentence level processing locates relevant pieces of information scattered throughout the text; second, discourse processing merges coreferential information to generate the output. In the first step, pieces of information are locally identified without recognizing any relationships among them. A key word search or simple pattern search can achieve this purpose. The second step requires deeper knowledge in order to understand relationships among separately identified pieces of information. Previous information extraction systems focused on the first step, partly because they were not required to link up each piece of information with other pieces. To link the extracted pieces of information and map them onto a structured output format, complex discourse processing is essential. This paper reports on a Japanese information extraction system that merges information using a pattern matcher and discourse processor. Evaluation results show a high level of system performance which approaches human performance.Comment: See http://www.jair.org/ for any accompanying file

    Aplicaci贸n de la teor铆a de agentes al modelo de Grafos para la detecci贸n de patrones en textos

    Get PDF
    Text mining puede ser definido como el descubrimiento de conocimiento en grandes colecciones de documentos. Se asocia principalmente al descubrimiento de patrones interesantes como clusters, asociaciones, desviaciones, similitudes, y diferencias. Por otro lado, los Attributed Relational Graphs (ARG) se definen como una extensi贸n de los grafos ordinarios asociando atributos discretos o reales a sus v茅rtices y arcos. El uso de los atributos permite a los ARG ser posibles de no s贸lo modelar estructuras topol贸gicas de una entidad sino tambi茅n sus propiedades no estructurales, que usualmente se pueden representar como vectores. Estas caracter铆sticas hacen a esta herramienta un elemento 煤til a la hora de realizar b煤squeda de patrones. Es por ello que, en este trabajo se define un algoritmo basado en grafos para la detecci贸n de patrones de textos. Debido a que el volumen de informaci贸n que se debe procesar es grande, dicho algoritmo contempla la aplicaci贸n del modelo de agentes para controlar de manera din谩mica el espacio de b煤squeda y, en consecuencia, reducir los tiempos de procesamiento de los textos.VIII Workshop de Agentes y Sistemas InteligentesRed de Universidades con Carreras en Inform谩tica (RedUNCI

    Aplicaci贸n de la teor铆a de agentes al modelo de Grafos para la detecci贸n de patrones en textos

    Get PDF
    Text mining puede ser definido como el descubrimiento de conocimiento en grandes colecciones de documentos. Se asocia principalmente al descubrimiento de patrones interesantes como clusters, asociaciones, desviaciones, similitudes, y diferencias. Por otro lado, los Attributed Relational Graphs (ARG) se definen como una extensi贸n de los grafos ordinarios asociando atributos discretos o reales a sus v茅rtices y arcos. El uso de los atributos permite a los ARG ser posibles de no s贸lo modelar estructuras topol贸gicas de una entidad sino tambi茅n sus propiedades no estructurales, que usualmente se pueden representar como vectores. Estas caracter铆sticas hacen a esta herramienta un elemento 煤til a la hora de realizar b煤squeda de patrones. Es por ello que, en este trabajo se define un algoritmo basado en grafos para la detecci贸n de patrones de textos. Debido a que el volumen de informaci贸n que se debe procesar es grande, dicho algoritmo contempla la aplicaci贸n del modelo de agentes para controlar de manera din谩mica el espacio de b煤squeda y, en consecuencia, reducir los tiempos de procesamiento de los textos.VIII Workshop de Agentes y Sistemas InteligentesRed de Universidades con Carreras en Inform谩tica (RedUNCI

    A Practical Guide to Interpretation of Large Collections of Incident Narratives Using the QUORUM Method

    Get PDF
    Analysis of incident reports plays an important role in aviation safety. Typically, a narrative description, written by a participant, is a central part of an incident report. Because there are so many reports, and the narratives contain so much detail, it can be difficult to efficiently and effectively recognize patterns among them. Recognizing and addressing recurring problems, however, is vital to continuing safety in commercial aviation operations. A practical way to interpret large collections of incident narratives is to apply the QUORUM method of text analysis, modeling, and relevance ranking. In this paper, QUORUM text analysis and modeling are surveyed, and QUORUM relevance ranking is described in detail with many examples. The examples are based on several large collections of reports from the Aviation Safety Reporting System (ASRS) database, and a collection of news stories describing the disaster of TWA Flight 800, the Boeing 747 which exploded in mid- air and crashed near Long Island, New York, on July 17, 1996. Reader familiarity with this disaster should make the relevance-ranking examples more understandable. The ASRS examples illustrate the practical application of QUORUM relevance ranking

    Pattern Matching and Discourse Processing in Information Extraction from Japanese Text

    No full text

    Anales del XIII Congreso Argentino de Ciencias de la Computaci贸n (CACIC)

    Get PDF
    Contenido: Arquitecturas de computadoras Sistemas embebidos Arquitecturas orientadas a servicios (SOA) Redes de comunicaciones Redes heterog茅neas Redes de Avanzada Redes inal谩mbricas Redes m贸viles Redes activas Administraci贸n y monitoreo de redes y servicios Calidad de Servicio (QoS, SLAs) Seguridad inform谩tica y autenticaci贸n, privacidad Infraestructura para firma digital y certificados digitales An谩lisis y detecci贸n de vulnerabilidades Sistemas operativos Sistemas P2P Middleware Infraestructura para grid Servicios de integraci贸n (Web Services o .Net)Red de Universidades con Carreras en Inform谩tica (RedUNCI

    Anales del XIII Congreso Argentino de Ciencias de la Computaci贸n (CACIC)

    Get PDF
    Contenido: Arquitecturas de computadoras Sistemas embebidos Arquitecturas orientadas a servicios (SOA) Redes de comunicaciones Redes heterog茅neas Redes de Avanzada Redes inal谩mbricas Redes m贸viles Redes activas Administraci贸n y monitoreo de redes y servicios Calidad de Servicio (QoS, SLAs) Seguridad inform谩tica y autenticaci贸n, privacidad Infraestructura para firma digital y certificados digitales An谩lisis y detecci贸n de vulnerabilidades Sistemas operativos Sistemas P2P Middleware Infraestructura para grid Servicios de integraci贸n (Web Services o .Net)Red de Universidades con Carreras en Inform谩tica (RedUNCI
    corecore