11 research outputs found

    Kausazko koherentzia-erlazioen azterketa automatikoa euskarazko laburpen zientifikoetan

    Get PDF
    Detecting automatically the cause relations of a text may be useful in question answering tasks and event information extraction. The aim of this paper is to study how to detect coherence relations of the cause subgroup (CAUSE, RESULT and PURPOSE). TO achieve this aim we have used the Rhetorical Structure Theory (RST) and some automatic linguistic information from different tools developed by IXA Group. We have used a corpus of 60 scientific abstracts, the Basque RST Treebank (Iruskieta et al., 2013), of different domains: science, medicine and terminology. A linguist has annotated all the signals of that corpus and described the most important problems in such task. To report the reliability of this annotator, two linguists have annotated the signals of the cause subgroup and all the annotations were compared and evaluated. After that, a superannotator has harmonized all the signals of those cause relations. Finally, we show the most important signals for such relations

    The Elaboration of human anatomy terminology for the Basque language : the contribution of translators, linguists and experts

    Get PDF
    En aquest article comparem la traducció d'un atles d'anatomia amb la revisió que es va encarregar a experts i lingüistes. L'objectiu és avaluar la mena de contribució que poden fer traductors, lingüistes i experts en l'elaboració de la terminologia de l'anatomia humana en basc. Analitzem les oracions que mostren discordances entre la traducció i la revisió respecte de les unitats lèxiques i les regles de formació usades. Hem observat que les correccions fetes pels experts i lingüistes tendeixen a substituir préstecs i calcs de regles de formació per unitats i estructures genuïnes. Arribem a la conclusió que les polítiques de planificació lingüística que pretenen proporcionar recursos terminològics propis en detriment de solucions dependents d'altres llengües no han estat assumides pels traductors per l'opacitat semàntica de la terminologia de l'anatomia i per la morfologia transparent del basc en comparació amb la del castellà.In this paper we compare the translation of an atlas of anatomy with the review that was carried out by experts in human anatomy and linguists. The goal is to evaluate the type of contribution that translators, linguists and experts can make in the elaboration of the terminology of human anatomy in Basque. We analyzed the sequences that showed discordances between translation and review with respect to the lexical units and the term formation patterns used. We found that the corrections made by experts and linguists show a clear tendency to replace lexical loanwords and calqued term formation rules by genuine elements and structures. We conclude that the aims of language planning policies of gradually providing the language with terminological resources that are less dependent on other languages have not been met by translators due to the semantic opacity of anatomical terminology and the transparent morphology of Basque compared with Spanish

    Emakumeen emozio-zurrunbiloa erditzean

    Get PDF
    Erditzea prozesu indibidual eta konplexua da, emakume bakoitzaren bizitzan mugarri dena. Erditze-gertaeran prozesu fisiologikoen eta psikologikoen arteko erlazioa gertatzen da, emakumearen, semearen edo alabaren ongizatean eta amaren eta bikotearen arteko harremanean eragina izan dezaketen gizarte-, ingurumen-, antolamendu- eta politika-testuinguruek eraginda. Gaur egungo osasun-paradigmen bidez sustatzen da erabiltzaileek eta osasun-profesionalek beren bizipenen alderdi positiboei eta negatiboei buruzko ikuspegia eta gogoetak adieraztea. Beraz, lan honetan aztertuko dira amek ospitaleko erditzean positibotzat edo negatibotzat hartzen dituzten esperientziak eta izandako emozioak eta sentimenduak. Emaitzak funtsezkoak dira erditzean emakumearengan zentratutako zaintza modu indibidualizatuan, pertsonalizatuan, holistikoan eta jarraituan bideratu ahal izateko, emakumearen balioak, aukerak, kultura eta emakumearen eta bikotekidearen nahiak errespetatuz.; Childbirth is an individual and complex process that represents a milestone in every woman's life. The birth episode involves a relationship between physiological and psychological processes influenced by social, environmental, organisational, and political contexts that may affect the well-being of the woman, the child and the relationship between the mother and the partner. Current health paradigms encourage users and health professionals to express their vision and reflections about the positive and negative aspects of their experiences. Therefore, this paper will analyse the experiences, emotions and feelings that mothers perceive as positive or negative in hospital birth. The results are essential for the delivery of woman-centred care in an individualized, personalized, holistic and continuous provision of woman-centred care in childbirth, respecting the values, opportunities, culture and wishes of the woman and the partner

    Extracción de relaciones léxico-semánticas a partir de palabras derivadas usando patrones de definición

    No full text
    Este trabajo se encuadra dentro de un proyecto de extracción de relaciones léxico-semánticas a partir del análisis de un diccionario monolingüe, y se centra en las relaciones existentes entre las palabras derivadas y sus raíces. En el estudio se incluyen tres sufijos con una sola interpretación y otros tres sufijos con más de una interpretación. La principal aportación de este artículo es un método para desambiguar las interpretaciones de los sufijos a partir de la definición que se le da en el diccionario a la palabra derivada. En otras palabras, cada interpretación de un sufijo estará unida a uno o varios patrones definitorios. El método consigue una alta precisión al escoger la interpretación correcta de la relación. Con el objetivo de integrar la información extraída en EuroWordNet, hemos explorado un nuevo método para la desambiguación automática de los sentidos tanto de la raíz como de la palabra derivada con buenos resultados. Por el contrario, la representación de las relaciones extraídas en EuroWordNet es todavía un tema abierto.Este trabajo se ha realizado gracias a una beca predoctoral otorgada por el Gobierno Vasco (BFI98.217,AE). Asimismo, se encuadra en los proyectos Hiztegia2002 (FEDER 2FD1997-1503) y HERMES (MCYT TIC2000-0335)

    Discourse unit and rhetorical relations: a study about discourse units in the annotation of a corpus in Basque

    Get PDF
    En este artículo se describe el estudio realizado sobre las características del etiquetado de la estructura de discurso, según la Teoría de la Estructura Retórica, en los niveles inter-oracional e intra-oracional. El corpus etiquetado está compuesto por textos médicos escritos en euskera y extraídos de la Gaceta Médica de Bilbao siendo nuestro objetivo final establecer una metodología general para la anotación de corpus a nivel discursivo. En este trabajo se analizan los acuerdos y desacuerdos de la anotación realizada por dos anotadores en cada nivel. Los resultados obtenidos sugieren que la segmentación en unidades de discurso es más compleja en el nivel intra-oracional mientras que la asignación de relaciones retóricas lo es en el nivel inter-oracional. Además hemos detectado que hay relaciones que aparecen con mayor frecuencia en cada nivel y otras se dan indistintamente en ambos niveles inter- e intra-oracional. Este estudio sienta las bases para el futuro desarrollo de un anotador automático de relaciones.This article describes the study on the features used for labelling the discourse structure, according to the Rhetorical Structure Theory, at the inter-sentential and intra-sentential levels. The tagged corpus is composed of medical texts written in Basque and extracted from the medical journal 'Gaceta Médica de Bilbao'. The difficulties encountered both while identifying the discourse units and while establishing the relations are analysed at each level based on the observation of agreement and disagreement identified in the texts annotated by two annotators. The results obtained suggest that the segmentation into units of discourse is more complex at the intra-sentential level while the assignment of rhetorical relations is more difficult at the inter-sentential level. We also note that some relations occur more frequently at the intra-sentential level and others at the inter-sentential level. However, there are relations that can appear indistinctively in both levels intra- and inter-sentential. This study will lay the foundations to carry out the automatic annotation process that the authors intend to perform shortly.Este trabajo ha sido realizado en el marco de los siguientes proyectos: Grupo IXA, Grupo consolidado 2007-2012 (IT-397-07) [Gobierno Vasco]; KNOW2 (TIN2009-14715-C04-01) [MICCIN], Hibrido Sint (TIN2010-20218) [MICCIN], y GARATERM2 (US10/01) [Gobierno Vasco]

    Etiquetado semiautomático del rasgo semántico de animicidad para su uso en un sistema de traducción automática

    Get PDF
    The ambiguity related to the use of movement and localisation declension cases in Basque is a serious problem in the morphological generation phase in Machine Translation. We present the approach we have developed to solve this ambiguity. Information about the [±animate] semantic feature of the lemma we want to decline is necessary to choose the appropriate suffix. The lexical database used does not contain such information. Besides, it would be very hard to add it manually to the 28.000 substantives contained in it. For this reason, we made two experiments to obtain the [±animate] feature from other resources. First, our aim was to get automatically the required knowledge from corpora, but the results were not good. Secondly, after a minimal manual tagging and using semantic relations between words extracted from definitions of a monolingual dictionary, we tagged more than half of the words in real texts with the [±animate] feature.Este trabajo está subvencionado por la Universidad del País Vasco (UPV 141.226-G19/99)

    Evaluation of a rule-based machine translation system or why BLEU is only useful for what it is meant to be used

    No full text
    Matxin es un sistema de traducción automática basado en reglas que traduce a euskera. Para su evaluación hemos usado la métrica HTER que calcula el coste de postedición, concluyendo que un editor necesitaría cambiar 4 de cada 10 palabras para corregir la salida del sistema. La calidad de las traducciones del sistema Matxin ha podido ser comparada con las de un sistema basado en corpus, obteniendo el segundo unos resultados significativamente peores. Debido al uso generalizado de BLEU, hemos querido estudiar los resultados BLEU conseguidos por ambos sistemas, constatando que esta métrica no es efectiva ni para medir la calidad absoluta de un sistema, ni para comparar sistemas que usan estrategias diferentes.Matxin is a rule-based machine translation system which translates to Basque. For its evaluation we have used the HTER metric which calculates the post-editing cost, concluding that 4 of each 10 words would have to be modified to correct the output generated by the system. We have compared the quality of Matxin translations with that of a corpus based system, and the results show that Matxin performs significantly better. Given the widespread use of BLEU, we have examined the BLEU scores for both systems, and we conclude that this metric is neither effective to measure the absolute quality of a system, nor suitable to compare systems based on different strategies.Esta investigación ha recibido ayuda del Ministerio de Educación y Ciencia a través de los proyectos OpenMT: Open Source Machine Translation using hybrid methods (TIN2006-15307-C03-01) y Ricoterm-3 (HUM2007-65966-CO2-02)

    Extracción de relaciones semánticas mediante una gramática de restricciones

    No full text
    Este artículo da cuenta de los primeros resultados de un proyecto destinado a extraer relaciones semánticas de las definiciones del diccionario monolingüe en euskara Euskal Hiztegia. La técnica para extraer dichas relaciones utiliza el mecanismo de mappings de las gramáticas de restricciones, que se apoyan en la información morfosintáctica ya provista por el analizador morfológico MORFEUS. Se presentan los resultados referentes a la extracción de las relaciones de sinonimia e hiperonimia, en la que se consigue etiquetar el 85% de las definiciones de los sustantivos. Cubrimos el 91,3% de las definiciones con genus/sinónimo con un error en la extracción del 5%, aunque el 98,9% de las definiciones etiquetadas tienen al menos un genus/sinónimo correcto. Los resultados obtenidos, así como el pequeño esfuerzo necesario, nos indican que es factible extraer relaciones semánticas a partir de la información morfosintáctica proporcionada en un tiempo razonable, ya sea para sustantivos, verbos o adjetivos.Este trabajo ha recibido ayudas del CYCIT (TIC96-1243-C03-02 proyecto ITEM) y de la UPV (141.226-TA073/96)
    corecore