19 research outputs found

    Compilation of the academic corpus of novels in Basque HARTAeus and its exploitation for the study of academic phraseology

    Get PDF
    Se ha compilado un corpus acad茅mico de noveles para el euskera comparable con el corpus HARTA-noveles para el espa帽ol. A partir del corpus se ha extra铆do una lista de vocabulario acad茅mico para el euskera, y sendas listas de colocaciones y f贸rmulas, a las que se les han asignado funciones discursivas. El objetivo 煤ltimo del proyecto HARTAes-vas, en el que se enmarca este trabajo, es dise帽ar una herramienta de ayuda a la escritura acad茅mica para las dos lenguas centrada en las combinaciones l茅xicas acad茅micas, que integre diccionario y corpus.An academic corpus of novices was compiled for Basque, comparable to the corpus HARTA-noveles for Spanish. A list of academic Basque vocabulary, collocations and formulas were extracted from the corpus, and then they were assigned discursive functions. The ultimate objective of the HARTAes-vas project, in which this work is framed, is to design a tool to help academic writing for Basque and Spanish focused on academic lexical combinations, integrating lexicographic information and corpora.Este trabajo es parte del proyecto HARTAvas (PID2019-109683GB-C22), financiado por el Ministerio de Ciencia e Innovaci贸n

    Creaci贸n y Simulaci贸n de Metodolog铆as de An谩lisis, Clasificaci贸n e Integraci贸n de Nuevos Requerimientos a Software Propietario

    Get PDF
    La priorizaci贸n de nuevos requerimientos a implementar en un software propietario es un punto fundamental para su mantenimiento, la conservaci贸n de la calidad, observaci贸n de las reglas de negocio y los est谩ndares de la empresa. Aunque existen herramientas de priorizaci贸n basadas en t茅cnicas probadas y reconocidas, las mismas requieren una calificaci贸n previa de cada requerimiento. Si la empresa cuenta con solicitudes provenientes de varios clientes de un mismo producto, aumentan los factores que afectan a la empresa, las herramientas disponibles no contemplan estos aspectos y hacen mucho m谩s compleja la tarea de calificaci贸n. Este trabajo de investigaci贸n abarca la realizaci贸n de un relevamiento de los m茅todos de priorizaci贸n y selecci贸n de nuevos requerimientos utilizados por empresas de la zona de Rosario, y la definici贸n de una metodolog铆a para la selecci贸n un nuevo requerimiento, que implica el an谩lisis y evaluaci贸n de todas las implicaciones sobre el producto de software y la empresa, respetando sus reglas de negocio. La metodolog铆a creada conduce a la definici贸n de los procesos para la construcci贸n de una herramienta de calificaci贸n y priorizaci贸n de nuevos requerimientos en software propietario que tiene solicitudes de varios clientes al mismo tiempo, con instrumentos de calificaci贸n que consideran todos los aspectos relacionados, proveer谩 t茅cnicas de priorizaci贸n actuales y emitir谩 informes personalizados seg煤n diferentes perspectivas de la empresa.Eje: Ingenier铆a de SoftwareRed de Universidades con Carreras en Inform谩tica (RedUNCI

    State-of-the-art on monolingual lexicography for Basque (Basque)

    No full text
    In this article, we give an overview of the evolution of Basque lexicography to the present, pointing out its main achievements and shortcomings, as well as its challenges for the future. Basque lexicography has a relatively short history, but a considerable amount of resources have been produced in the last 50 years, since the standardisation process began. After years of lexicographic work by different groups and publishers, a remarkable achievement is the Dictionary of the Academy (Euskaltzaindiaren Hiztegia), a prescriptive updated dictionary recently published and based on historical and contemporary corpora. Although the number of monolingual products is noticeably increasing in the last years, Basque dictionary making has been specially productive for bilingual purposes, due probably to the sociolinguistic status of the language. On the other hand, specialized lexicography and terminology have been very active from the beginning of the standadisartion process. Since the beginning of the XXI. century, use of corpora has known an increasing impulse. Many Basque dictionaries are freely available on the Internet

    Zuzenketen Kudeaketa eta Hizkuntz Zerbitzuak

    No full text

    Idiomatikotasunaren karakterizazio automatikoa: izena+aditza

    Get PDF
    Ikerkuntza-lan honen helburua izan da izena+aditza osaerako unitate fraseologikoak (UFak) corpusetik automatikoki eskuratzeko eta haien idiomatikotasunaren arabera karakterizatzeko teknikak garatzea eta esperimentalki testatzea. Idiomatikotasuna UFen ezaugarri definitzailetzat hartu dugu, eta haren lau propietate hauek hartu ditugu neurgai gisa: instituzionalizazioa (idiosinkrasia estatistikoa), ez-konposizionaltasun semantikoa, finkapen morfosintaktikoa eta finkapen lexikala. Ondorio nagusia da arlo honetan estandar diren agerkidetza-tekniken emaitzak modu esanguratsuan gainditu direla, batez ere teknika semantikoen bidez, baina baita malgutasun morfosintaktikoaren neurketen bidez ere. Aldiz, malgutasun lexikalaren neurketek ez dute espero izatekoa zen mailako emaitza izan. Azkenik, teoria fraseologikoaren aurresan batzuen ebidentzia esperimentalak lortu ditugu.; The goal of this research is to develop and experimentally test different techniques for the automatic extraction of phraseological units (PUs) of noun+verb structure in Basque and for their characterization according to the idiomaticity level. Idiomaticity is considered the defining feature of the concept of phraseological unit (PU), ande we have measured its following components: institutionalization (statistical idiosyncrasy), semantic non-compositionality, morphosyntact ic fixedness and lexical fixedness. The results show that the standard cooccurence techniques are significantly ourtperformed by semantic measures, and, to a lower extent, by measures of morphosyntactic flexibility. The results of lexical flexibility are poorer than expected. Finally, we obtain experimental evidence for several predictions of phraseological theory
    corecore