8,678,892 research outputs found

    Wide-coverage deep statistical parsing using automatic dependency structure annotation

    Get PDF
    A number of researchers (Lin 1995; Carroll, Briscoe, and Sanfilippo 1998; Carroll et al. 2002; Clark and Hockenmaier 2002; King et al. 2003; Preiss 2003; Kaplan et al. 2004;Miyao and Tsujii 2004) have convincingly argued for the use of dependency (rather than CFG-tree) representations for parser evaluation. Preiss (2003) and Kaplan et al. (2004) conducted a number of experiments comparing “deep” hand-crafted wide-coverage with “shallow” treebank- and machine-learning based parsers at the level of dependencies, using simple and automatic methods to convert tree output generated by the shallow parsers into dependencies. In this article, we revisit the experiments in Preiss (2003) and Kaplan et al. (2004), this time using the sophisticated automatic LFG f-structure annotation methodologies of Cahill et al. (2002b, 2004) and Burke (2006), with surprising results. We compare various PCFG and history-based parsers (based on Collins, 1999; Charniak, 2000; Bikel, 2002) to find a baseline parsing system that fits best into our automatic dependency structure annotation technique. This combined system of syntactic parser and dependency structure annotation is compared to two hand-crafted, deep constraint-based parsers (Carroll and Briscoe 2002; Riezler et al. 2002). We evaluate using dependency-based gold standards (DCU 105, PARC 700, CBS 500 and dependencies for WSJ Section 22) and use the Approximate Randomization Test (Noreen 1989) to test the statistical significance of the results. Our experiments show that machine-learning-based shallow grammars augmented with sophisticated automatic dependency annotation technology outperform hand-crafted, deep, widecoverage constraint grammars. Currently our best system achieves an f-score of 82.73% against the PARC 700 Dependency Bank (King et al. 2003), a statistically significant improvement of 2.18%over the most recent results of 80.55%for the hand-crafted LFG grammar and XLE parsing system of Riezler et al. (2002), and an f-score of 80.23% against the CBS 500 Dependency Bank (Carroll, Briscoe, and Sanfilippo 1998), a statistically significant 3.66% improvement over the 76.57% achieved by the hand-crafted RASP grammar and parsing system of Carroll and Briscoe (2002)

    Bruket av demonstrativa pronomen och bestämd form i östnyländska samtal och intervjuer

    Get PDF

    The RDF data cube vocabulary

    Get PDF
    El vocabulario de cubo de datos proporciona un medio para poder publicar datos multidimensionales en la web, como por ejemplo las estadísticas, de tal manera que pueden estar vinculados a conjuntos y conceptos de datos relacionados. Este vocabulario utiliza el estándar W3C RDF (Resource Description Framework). La base del modelo del vocabulario de cubo de datos es compatible con el modelo cubo que subyace en SDMX (Statistical Data and Metadata eXchange), un estándar ISO para intercambiar y compartir datos y metadatos estadísticos entre las organizaciones. El vocabulario de cubo de datos es una base fundamental que apoya vocabularios de extensión para permitir la publicación de otros aspectos de los flujos de datos estadísticos u otros conjuntos de datos multidimensionales.W3

    RDF 1.1 Turtle : terse RDF triple language

    Get PDF
    RDF es un lenguaje de objetivo general para la representación de la información en la Web. Este documento define una sintaxis textual para RDF llamada Turtle que permite a un grafo RDF ser completamente escrito en un formulario de texto compacto y natural, con las abreviaturas para los patrones y tipos de datos de uso común. Turtle ofrece niveles de compatibilidad con el formato N-Triples, así como la sintaxis de patrón triple de la Recomendación SPARQL del W3C.W3

    Semantic annotations for WSDL and XML schema

    Get PDF
    Anotaciones semánticas para WSDL y esquema XML (SAWSDL) define cómo añadir anotaciones semánticas en varias partes de un documento WSDL como la estructura de los mensajes de entrada y de salida, interfaces y operaciones. Los atributos anexos están definidos en esta forma dentro de los marcos de extensibilidad de WSDL 2.0 [WSDL 2.0], WSDL 1.1 [WSDL 1.1] y XML Schema

    Internationalization Tag Set (ITS) version 2.0

    Get PDF
    La tecnología descrita para el conjunto de etiquetas de internacionalización (ITS) 2.0 mejora el fundamento para integrar el procesamiento automático del lenguaje humano en tecnologías Web básicas. ITS 2.0 alberga muchas cosas en común con su predecesor, ITS 1.0, pero proporciona conceptos adicionales que están diseñados para fomentar la creación y tratamiento automatizado de contenido web multilingüe. ITS 2.0 se centra en HTML, formatos basados ​​en XML en general, y pueden aprovechar el procesamiento basado en el formato de archivo de intercambio de localización XML (XLIFF), así como el formato de intercambio de procesamiento de lenguaje natural (NIF).W3

    Role attribute 1.0 : an attribute to support the role classification of elements

    Get PDF
    El atributo "rol" definido en esta especificación permite al autor anotar lenguajes de marcado con información semántica sobre el propósito de un elemento. Los casos de uso incluyen accesibilidad, adaptación de dispositivo, procesamiento del servidor, y descripción de datos complejos. Este atributo se puede integrar en cualquier lenguaje de marcas. En particular, se proporcionan implementaciones de esquema con lenguajes basados en modularización XHTML. El atributo rol es necesario para apoyar aplicaciones accesibles de Internet enriquecidas (WAI-ARIA) para definir los roles basados en lenguajes XML, cuando los lenguajes no definen su propio atributo "rol".W3

    SKOS Simple Knowledge Organization System Primer

    Get PDF
    SKOS (siglas de Simple Knowledge Organization System) es una iniciativa del W3C en forma de aplicación de RDF que proporciona un modelo para representar la estructura básica y el contenido de esquemas conceptuales como listas de encabezamientos de materia, taxonomías, esquemas de clasificación, tesauros y cualquier tipo de vocabulario controlado.W3

    Internationalization Tag Set (ITS) version 1.0

    Get PDF
    Este documento define las categorías de datos y su aplicación como un conjunto de elementos y atributos llamado conjunto de etiquetas de Internacionalización (ITS- Internationalization Tag Set). ITS está diseñado para ser utilizado con esquemas de apoyo a la internacionalización y la localización de esquemas y documentos. Su implementación es compatible con tres lenguajes de esquema: el DTD de XML, XML Schema y RELAX NG
    corecore