12 research outputs found

    Weba euskarazko corpus gisa

    Get PDF
    The Basque language. just as any other, needs text corpora to survive in the modern world and to be used normally. But Basque corpora are few and small compared to those in other major languages. This is so because other languages have made use of the "Web-as-Corpus" approach , which consists of using the web as a corpus or as a source of texts for corpora. ln this paper, we describe the research carried out in his PhD thesis by the first author, under the supervision of the other two authors, to use the web and automatic methods for Basque corpus building, and also the tools developed and the results obtained. Out of them we can conclude that the "Web-as-Corpus" approach is val id to improve the state of Basque corpora , since with the developed tools we have collected quality corpora of different types (very large general corpora, specialized corpora, comparable corpora ... ) and built a service to query the web as a Basque corpus.Many of these tools and services ha ve already been placed online for their public use.; Euskarak, beste edozein hizkuntzak bezala , testu-corpusak behar ditu mundu modernoan bizirauteko eta normalki erabiltzeko. Alabaina , euskarazko corpusak gutxi eta txikiak dira , beste hizkuntza handiagoenekin konparatuz gero. Hori horrela da beste hizkuntzek "Web-as-Corpus" izeneko planteamendua baliatu dutelako, hau da, weba erabili dutelako corpus gisa edo corpusak osatzeko testu-iturritzat . Artikulu honetan azaltzen dira bere doktorego-tesian lehenengo autoreak, beste bi autoreen zuzendaritzapean, euskarazko corpusgintzarako weba eta metodo automatikoak baliatzeko egindako ikerketak, aratutako tresnak eta lortutako emaitzak . Horietatik ondorioztatu daiteke "Web-as-Corpus" planteamendua baliagarria dela euskarazko corpusen egoera hobetzeko, garatu diren tresna informatikoen bidez weba corpus gisa kontsultatzeko tresna bat eraiki baita eta mota askotako eta kalitatezko corpusak lortu ahal izan baitira (corpus orokor oso handiak, corpus espezializatuak, corpus konparagarriak, .. ). Horietako asko jada online gizartearen eskura jarri dira

    Itzulpen automatikorako gaztelania-euskara patroiak : lehen urratsak

    Get PDF
    [EU]Lan honetan, adibideetan oinarritutako patroi batzuk sortu ditugu, erregeletan oinarritutako itzulpen-sistema automatiko bat hobetzeko asmoz. Patroirik erabilgarrienak emango zituzten adibideak bakarrik hartzeko, euren erabilera-maiztasunari eta itzulpen automatikoen egokitasunari erreparatu diegu. Ondoren, adibideetako entitate-izenak eta zenbakiak orokortu ditugu, elementu horiek aldatuta ere, patroiak erabili ahal izateko

    Wikipedia eta itzulpen automatikoa: "harri batez bizpalau xori"

    Get PDF
    Artikulu honetan elkarlanean egindako proiektu bat aurkezten dugu. Boluntario talde bat bildu dugu espainierazko Wikipediako hainbat artikulu euskarara itzultzeko, baina boluntarioen lana errazteko, Matxin itzultzaile automatikoa erabili dugu aurreitzulpenak sortzeko, eta horrela boluntarioen lana errare eta akatsak dituzten itzulpen automatiko horiek aztertu eta zuzentzea izan da. Lan honekin, batetik, Euskal Wikipedia aberastu dugu, 50.000 hitz berri gehituz. Beste alde batetik, sistema automatikoaren itzulpenak eta posteditatutako bertsio zuzenduekin corpus bat sortu dugu. Corpus hori erabili dugu posteditore estatistiko bat sortzeko, Matxin itzulpen automatikoko sistemaren irteeraren doitasuna % 10ean hobetuz

    Caprate: un sistema de interpretación de problemas en lenguaje natural

    No full text
    199 p.Caprate es un sistema de comprensión de lenguaje natural que procesa enunciados de problemas elementales de programación escritos en español, obteniendo la especificación correspondiente al problema según el lenguaje de especificación formal de Capra (un sistema de enseñanza inteligente asistida por ordenador). La independencia existente en la definición de las herramientas lingüísticas y las relativas al dominio de aplicación permite una fácil adecuación a otros dominios. El intérprete de ATNS implementado permite el uso intercalado de conocimiento sintáctico y semántico, ofreciendo herramientas poderosas para una rápida desambiguación sintáctica, para el tratamiento de elipsis y referencias, así como para la construcción del significado del texto. El sistema de definición y control de expectativas semánticas (clasificadas entre necesarias, añadibles y añadibles generales) unido al uso de un conjunto de reglas que examina la completitud de la representación semántica obtenida facilitan una definición sencilla y flexible del conocimiento necesario para cada aplicación concreta

    Caprate: un sistema de interpretación de problemas en lenguaje natural

    No full text
    199 p.Caprate es un sistema de comprensión de lenguaje natural que procesa enunciados de problemas elementales de programación escritos en español, obteniendo la especificación correspondiente al problema según el lenguaje de especificación formal de Capra (un sistema de enseñanza inteligente asistida por ordenador). La independencia existente en la definición de las herramientas lingüísticas y las relativas al dominio de aplicación permite una fácil adecuación a otros dominios. El intérprete de ATNS implementado permite el uso intercalado de conocimiento sintáctico y semántico, ofreciendo herramientas poderosas para una rápida desambiguación sintáctica, para el tratamiento de elipsis y referencias, así como para la construcción del significado del texto. El sistema de definición y control de expectativas semánticas (clasificadas entre necesarias, añadibles y añadibles generales) unido al uso de un conjunto de reglas que examina la completitud de la representación semántica obtenida facilitan una definición sencilla y flexible del conocimiento necesario para cada aplicación concreta

    Natural Language Understanding and Logic Programming

    No full text

    Comprensión de problemas de programación en LN

    No full text

    The Biochemical Composition and Energy Content of Arctic Marine Macrozooplankton

    Get PDF
    Protein, lipid, carbohydrate, water, ash and caloric energy contents during the open water season of 14 species of macrozooplankton and four epibenthic amphipods common to the inshore waters of southern Baffin Island are compared. . The highest energy content occurred in euphausiids and hyperiid amphipods and the lowest in ctenophores and cnidarians. Lipid appeared to be an important energy reserve in most of the species examined while carbohydrate concentrations were consistently low. In four dominant species (Mertensia ovum, Parathemisto libellula, Sagitta elegans and Thysanoessa inermis) there was evidence of a progressive increase in lipid and caloric energy content during the course of the summer. Similarities and differences in biochemical composition and energy content of zooplankton from the Arctic and other marine areas are briefly discussed.Key words: arctic zooplankton, marine, biochemical composition, calories, energy conten

    Itzulpen automatikorako gaztelania-euskara patroiak : lehen urratsak

    No full text
    [EU]Lan honetan, adibideetan oinarritutako patroi batzuk sortu ditugu, erregeletan oinarritutako itzulpen-sistema automatiko bat hobetzeko asmoz. Patroirik erabilgarrienak emango zituzten adibideak bakarrik hartzeko, euren erabilera-maiztasunari eta itzulpen automatikoen egokitasunari erreparatu diegu. Ondoren, adibideetako entitate-izenak eta zenbakiak orokortu ditugu, elementu horiek aldatuta ere, patroiak erabili ahal izateko
    corecore