7 research outputs found

    ANHITZ: sistema diccionarial multilingüe de ayuda en la traducción

    No full text
    Resumen de la tesis doctoral presentada en la Facultad de Informática de Donostia, Universidad del País Vasco, en julio de 1995

    Resolución de coreferencia para lenguajes morfológicamente ricas. Adaptación del sistema de Stanford al euskera

    No full text
    This paper presents the adaptation of the Stanford coreference resolution system to Basque, an agglutinative head-final pro-drop language. The adapted system has been integrated into a global linguistic analysis pipeline so that the input of the system are original Basque raw texts linguistically processed, and annotated. We demonstrate that language-specific characteristics have a noteworthy effect on coreference resolution. In the case of agglutinative languages the use of morphosyntactic features improves substantially the system's performance, obtaining a gain in CoNLL F1 results of 5 points when automatic mentions are used and of 7.87 points when gold mentions are provided.Este artículo presenta el proceso de adaptación del sistema de resolución de coreferencia de Stanford para el euskera, un idioma aglutinante, de núcleo final y pro-drop. Este sistema ha sido integrado en una cadena de análisis lingüística de manera que recibe como entrada textos procesados y analizados para el euskera. Hemos demostrado que haciendo uso de las características lingüísticas del lenguaje se puede mejorar la resolución de la coreferencia. En el caso de los lenguajes aglutinantes el uso de características morfosintácticas mejora claramente el rendimiento del sistema obteniéndose un incremento en CoNLL F1 de 5 puntos para el caso de menciones automáticas y de 7,87 puntos con menciones gold.This work has been supported by Ander Soraluze's PhD grant from Euskara Errektoreordetza, the University of the Basque Country (UPV/EHU) and by the Ber2Tek project, Basque Government (IE12-333)

    Un entorno para el desarrollo y la evaluación de un sistema de búsqueda de respuestas en euskera

    Get PDF
    En este artículo se presenta una plataforma de desarrollo y evaluación de un sistema de búsqueda de respuestas (BR), para preguntas escritas en euskera y sobre una colección de documentos en euskera. La plataforma integra tres componentes: el propio sistema de BR, el componente léxico y el entorno de evaluación. El sistema de BR se ha ideado atendiendo a los requisitos de evaluación. Se ha optado por una arquitectura distribuida, que integra servicios web autónomos. Se describe una experiencia piloto, que ha permitido validar la adecuación del entorno y que sienta las bases para el trabajo futuro.This paper presents a development and evaluation platform for a question answering (QA) system. It is a monolingual system, which takes as input Basque questions and searches for answers in a Basque document collection. Three components integrate the platform: the QA system, the lexical component and the evaluation environment. The QA system has been designed taking into account the evaluation requirements. A distributed architecture with stand-alone web services has been adopted. A pilot experiment is also described and this experiment has allowed ratifying the environment adaptation and has laid the foundations for future work.Este trabajo está subvencionado por el Departamento de Industria del Gobierno Vasco (proyectos Ihardetsi SAIOTEK S-PE03UN14 e Hizking21 ETORTEK2002HIZKING21)

    Sistema diccionarial multilingüe: aproximación funcional

    No full text
    El Sistema Diccionarial Multilingüe (SDM) que aquí presentamos se ha concebido como un sistema de ayuda al traductor humano. SDM es un sistema computacional on-line ideado para su uso en entornos de trabajo para la traducción. Su base de conocimiento se construye a partir de diccionarios de distintas lenguas (en la implementación actual de diccionarios de francés y de euskara). El desarrollo del sistema monolingüe SIAD, Sistema Inteligente de Ayuda Diccionarial [Artola, 93], constituye la base y el punto de partida en el diseño de la Base de Conocimiento Diccionarial Multilingüe. La descripción del entorno funcional constituye la primera fase en el diseño de SDM. La metodología seguida en la definición de las funciones de SDM se ha basado en la observación directa de la labor de los traductores y en entrevistas personales a traductores profesionales. Mediante este análisis se ha caracterizado el uso típico de los diccionarios en la traducción, incidiendo sobre todo en los aspectos cualitativos. Actualmente se está trabajando en la representación del conocimiento diccionarial multilingüe, análisis de las relaciones existentes y características que debe tener dicha representación para abordar la puesta en marcha de la funcionalidad descrita

    Extracción de relaciones semánticas mediante una gramática de restricciones

    No full text
    Este artículo da cuenta de los primeros resultados de un proyecto destinado a extraer relaciones semánticas de las definiciones del diccionario monolingüe en euskara Euskal Hiztegia. La técnica para extraer dichas relaciones utiliza el mecanismo de mappings de las gramáticas de restricciones, que se apoyan en la información morfosintáctica ya provista por el analizador morfológico MORFEUS. Se presentan los resultados referentes a la extracción de las relaciones de sinonimia e hiperonimia, en la que se consigue etiquetar el 85% de las definiciones de los sustantivos. Cubrimos el 91,3% de las definiciones con genus/sinónimo con un error en la extracción del 5%, aunque el 98,9% de las definiciones etiquetadas tienen al menos un genus/sinónimo correcto. Los resultados obtenidos, así como el pequeño esfuerzo necesario, nos indican que es factible extraer relaciones semánticas a partir de la información morfosintáctica proporcionada en un tiempo razonable, ya sea para sustantivos, verbos o adjetivos.Este trabajo ha recibido ayudas del CYCIT (TIC96-1243-C03-02 proyecto ITEM) y de la UPV (141.226-TA073/96)

    Extracción de relaciones semánticas mediante una gramática de restricciones

    No full text
    Este artículo da cuenta de los primeros resultados de un proyecto destinado a extraer relaciones semánticas de las definiciones del diccionario monolingüe en euskara Euskal Hiztegia. La técnica para extraer dichas relaciones utiliza el mecanismo de mappings de las gramáticas de restricciones, que se apoyan en la información morfosintáctica ya provista por el analizador morfológico MORFEUS. Se presentan los resultados referentes a la extracción de las relaciones de sinonimia e hiperonimia, en la que se consigue etiquetar el 85% de las definiciones de los sustantivos. Cubrimos el 91,3% de las definiciones con genus/sinónimo con un error en la extracción del 5%, aunque el 98,9% de las definiciones etiquetadas tienen al menos un genus/sinónimo correcto. Los resultados obtenidos, así como el pequeño esfuerzo necesario, nos indican que es factible extraer relaciones semánticas a partir de la información morfosintáctica proporcionada en un tiempo razonable, ya sea para sustantivos, verbos o adjetivos.Este trabajo ha recibido ayudas del CYCIT (TIC96-1243-C03-02 proyecto ITEM) y de la UPV (141.226-TA073/96)
    corecore