8 research outputs found
Pattern Matching and Discourse Processing in Information Extraction from Japanese Text
Information extraction is the task of automatically picking up information of
interest from an unconstrained text. Information of interest is usually
extracted in two steps. First, sentence level processing locates relevant
pieces of information scattered throughout the text; second, discourse
processing merges coreferential information to generate the output. In the
first step, pieces of information are locally identified without recognizing
any relationships among them. A key word search or simple pattern search can
achieve this purpose. The second step requires deeper knowledge in order to
understand relationships among separately identified pieces of information.
Previous information extraction systems focused on the first step, partly
because they were not required to link up each piece of information with other
pieces. To link the extracted pieces of information and map them onto a
structured output format, complex discourse processing is essential. This paper
reports on a Japanese information extraction system that merges information
using a pattern matcher and discourse processor. Evaluation results show a high
level of system performance which approaches human performance.Comment: See http://www.jair.org/ for any accompanying file
Aplicaci贸n de la teor铆a de agentes al modelo de Grafos para la detecci贸n de patrones en textos
Text mining puede ser definido como el descubrimiento de conocimiento en grandes colecciones de documentos. Se asocia principalmente al descubrimiento de patrones interesantes como clusters, asociaciones, desviaciones, similitudes, y diferencias. Por otro lado, los Attributed Relational Graphs (ARG) se definen como una extensi贸n de los grafos ordinarios asociando atributos discretos o reales a sus v茅rtices y arcos. El uso de los atributos permite a los ARG ser posibles de no s贸lo modelar estructuras topol贸gicas de una entidad sino tambi茅n sus propiedades no estructurales, que usualmente se pueden representar como vectores. Estas caracter铆sticas hacen a esta herramienta un elemento 煤til a la hora de realizar b煤squeda de patrones. Es por ello que, en este trabajo se define un algoritmo basado en grafos para la detecci贸n de patrones de textos. Debido a que el volumen de informaci贸n que se debe procesar es grande, dicho algoritmo contempla la aplicaci贸n del modelo de agentes para controlar de manera din谩mica el espacio de b煤squeda y, en consecuencia, reducir los tiempos de procesamiento de los textos.VIII Workshop de Agentes y Sistemas InteligentesRed de Universidades con Carreras en Inform谩tica (RedUNCI
Aplicaci贸n de la teor铆a de agentes al modelo de Grafos para la detecci贸n de patrones en textos
Text mining puede ser definido como el descubrimiento de conocimiento en grandes colecciones de documentos. Se asocia principalmente al descubrimiento de patrones interesantes como clusters, asociaciones, desviaciones, similitudes, y diferencias. Por otro lado, los Attributed Relational Graphs (ARG) se definen como una extensi贸n de los grafos ordinarios asociando atributos discretos o reales a sus v茅rtices y arcos. El uso de los atributos permite a los ARG ser posibles de no s贸lo modelar estructuras topol贸gicas de una entidad sino tambi茅n sus propiedades no estructurales, que usualmente se pueden representar como vectores. Estas caracter铆sticas hacen a esta herramienta un elemento 煤til a la hora de realizar b煤squeda de patrones. Es por ello que, en este trabajo se define un algoritmo basado en grafos para la detecci贸n de patrones de textos. Debido a que el volumen de informaci贸n que se debe procesar es grande, dicho algoritmo contempla la aplicaci贸n del modelo de agentes para controlar de manera din谩mica el espacio de b煤squeda y, en consecuencia, reducir los tiempos de procesamiento de los textos.VIII Workshop de Agentes y Sistemas InteligentesRed de Universidades con Carreras en Inform谩tica (RedUNCI
A Practical Guide to Interpretation of Large Collections of Incident Narratives Using the QUORUM Method
Analysis of incident reports plays an important role in aviation safety. Typically, a narrative description, written by a participant, is a central part of an incident report. Because there are so many reports, and the narratives contain so much detail, it can be difficult to efficiently and effectively recognize patterns among them. Recognizing and addressing recurring problems, however, is vital to continuing safety in commercial aviation operations. A practical way to interpret large collections of incident narratives is to apply the QUORUM method of text analysis, modeling, and relevance ranking. In this paper, QUORUM text analysis and modeling are surveyed, and QUORUM relevance ranking is described in detail with many examples. The examples are based on several large collections of reports from the Aviation Safety Reporting System (ASRS) database, and a collection of news stories describing the disaster of TWA Flight 800, the Boeing 747 which exploded in mid- air and crashed near Long Island, New York, on July 17, 1996. Reader familiarity with this disaster should make the relevance-ranking examples more understandable. The ASRS examples illustrate the practical application of QUORUM relevance ranking
Anales del XIII Congreso Argentino de Ciencias de la Computaci贸n (CACIC)
Contenido:
Arquitecturas de computadoras
Sistemas embebidos
Arquitecturas orientadas a servicios (SOA)
Redes de comunicaciones
Redes heterog茅neas
Redes de Avanzada
Redes inal谩mbricas
Redes m贸viles
Redes activas
Administraci贸n y monitoreo de redes y servicios
Calidad de Servicio (QoS, SLAs)
Seguridad inform谩tica y autenticaci贸n, privacidad
Infraestructura para firma digital y certificados digitales
An谩lisis y detecci贸n de vulnerabilidades
Sistemas operativos
Sistemas P2P
Middleware
Infraestructura para grid
Servicios de integraci贸n (Web Services o .Net)Red de Universidades con Carreras en Inform谩tica (RedUNCI
Anales del XIII Congreso Argentino de Ciencias de la Computaci贸n (CACIC)
Contenido:
Arquitecturas de computadoras
Sistemas embebidos
Arquitecturas orientadas a servicios (SOA)
Redes de comunicaciones
Redes heterog茅neas
Redes de Avanzada
Redes inal谩mbricas
Redes m贸viles
Redes activas
Administraci贸n y monitoreo de redes y servicios
Calidad de Servicio (QoS, SLAs)
Seguridad inform谩tica y autenticaci贸n, privacidad
Infraestructura para firma digital y certificados digitales
An谩lisis y detecci贸n de vulnerabilidades
Sistemas operativos
Sistemas P2P
Middleware
Infraestructura para grid
Servicios de integraci贸n (Web Services o .Net)Red de Universidades con Carreras en Inform谩tica (RedUNCI