8 research outputs found
La estructura y la semántica de los compuestos nominales en urarina
La presente tesis aborda el análisis de los compuestos nominales en la lengua
urarina, una lengua aislada de la Amazonía peruana. Se ha elaborado estudios previos
enfocados en la fonología y gramática de la lengua, mas no se cuenta con una descripción
pormenorizada de aspectos ligados a la formación de palabras y la construcción del
significado léxico. La finalidad de esta tesis es describir la estructura de los compuestos
nominales, así como las motivaciones semánticas que subyacen a la formación de estos
nombres desde la perspectiva de la gramática de construcciones y la lingüística cognitiva,
a partir de conceptos como metáfora, metonimia, espacios mentales e integración
conceptual. Para ello, se analiza tanto la forma como el contenido de un corpus de
entradas elaborado a partir de algunos datos extraídos de la literatura disponible, así como
de datos propios recogidos en visitas a una comunidad urarina, los cuales abarcan diversos
campos semánticos. Esta tesis demuestra que los nombres compuestos, que presentan
características que lindan entre los nombres y las frases, se comportan como unidades
léxicas que exhiben patrones estructurales y semánticos sistemáticos, incluso aquellos
denominados exocéntricos. Asimismo, esta propuesta muestra que procesos metafóricos
y metonímicos son productivos y motivan la formación de ciertas construcciones
Cancionero en lengua originaria Chamicuro
Conjunto de canciones recopiladas o creadas por la población. Está dirigido a las niñas y niños del primer y segundo grado de educación primaria. Tiene el propósito de mejorar la expresión oral y musical en la lengua originaria, asimismo contribuye al desarrollo de la competencia “Se comunica oralmente en su lengua materna” del área de comunicación. Por otra parte, contribuye al fortalecimiento de la identidad en los estudiantes de las instituciones educativas de Educación Intercultural Bilingüe
SIGMORPHON 2021 Shared Task on Morphological Reinflection: Generalization Across Languages
This year's iteration of the SIGMORPHON Shared Task on morphological reinflection focuses on typological diversity and cross-lingual variation of morphosyntactic features. In terms of the task, we enrich UniMorph with new data for 32 languages from 13 language families, with most of them being under-resourced: Kunwinjku, Classical Syriac, Arabic (Modern Standard, Egyptian, Gulf), Hebrew, Amharic, Aymara, Magahi, Braj, Kurdish (Central, Northern, Southern), Polish, Karelian, Livvi, Ludic, Veps, Võro, Evenki, Xibe, Tuvan, Sakha, Turkish, Indonesian, Kodi, Seneca, Asháninka, Yanesha, Chukchi, Itelmen, Eibela. We evaluate six systems on the new data and conduct an extensive error analysis of the systems' predictions. Transformer-based models generally demonstrate superior performance on the majority of languages, achieving >90% accuracy on 65% of them. The languages on which systems yielded low accuracy are mainly under-resourced, with a limited amount of data. Most errors made by the systems are due to allomorphy, honorificity, and form variation. In addition, we observe that systems especially struggle to inflect multiword lemmas. The systems also produce misspelled forms or end up in repetitive loops (e.g., RNN-based models). Finally, we report a large drop in systems' performance on previously unseen lemmas.Peer reviewe
UniMorph 4.0:Universal Morphology
The Universal Morphology (UniMorph) project is a collaborative effort providing broad-coverage instantiated normalized morphological inflection tables for hundreds of diverse world languages. The project comprises two major thrusts: a language-independent feature schema for rich morphological annotation and a type-level resource of annotated data in diverse languages realizing that schema. This paper presents the expansions and improvements made on several fronts over the last couple of years (since McCarthy et al. (2020)). Collaborative efforts by numerous linguists have added 67 new languages, including 30 endangered languages. We have implemented several improvements to the extraction pipeline to tackle some issues, e.g. missing gender and macron information. We have also amended the schema to use a hierarchical structure that is needed for morphological phenomena like multiple-argument agreement and case stacking, while adding some missing morphological features to make the schema more inclusive. In light of the last UniMorph release, we also augmented the database with morpheme segmentation for 16 languages. Lastly, this new release makes a push towards inclusion of derivational morphology in UniMorph by enriching the data and annotation schema with instances representing derivational processes from MorphyNet
Diccionario visual en lengua originaria Chamicuro
El diccionario visual de nivel primaria es un recurso pedagógico para los estudiantes, se encuentran impresos en las diferentes lenguas de los pueblos originarios. El diccionario visual es un diccionario organizado en campos semánticos y presentan imágenes para apoyar e ilustrar la comprensión de las palabras y expresiones lingüísticas en la lengua originaria. Las palabras e imágenes de cada campo semántico se encuentran organizadas en orden alfabético. Las imágenes que acompañan a las palabras son propias y conocidas del contexto con la finalidad de garantizar su aprendizaje y el uso de la lengua