Desarrollo de recursos y modelos para la traducción de Lengua de Señas Argentina

Abstract

La Lengua de Señas Argentina (LSA) es fundamental para la comunicación y el acceso a la información de la comunidad sorda en Argentina. Sin embargo, la ausencia de traductores automáticos entre LSA y español limita la inclusión y la interacción efectiva con personas oyentes. Este trabajo aborda esta problemática mediante el desarrollo de recursos y modelos para la Traducción de Lengua de Señas (SLT) de LSA al español. En esta tesis se presenta LSA-T, el primer conjunto de datos continuo de LSA, que incluye más de 20 horas de video del canal de YouTube CN Sordos. Este conjunto de datos contiene traducciones al español y datos posicionales de los señantes, superando las limitaciones de bases de datos previas que solo incluían señas aisladas. LSA-T es esencial para entrenar modelos de SLT y abordar desafíos específicos de la traducción de lengua de señas. Además, se desarrolla Seni.ar, una aplicación diseñada para validar y ampliar LSA-T con la colaboración de expertos y la comunidad. Esta herramienta mejora la calidad y cantidad de datos disponibles, facilita la expansión continua de la base de datos y promueve la participación activa de la comunidad sorda y especialistas en LSA. Finalmente, se diseña y evalúa un modelo neuronal de SLT basado en información posicional, entrenado con LSA-T y validado en conjuntos de datos de otras lenguas de señas. Los resultados demuestran la viabilidad del enfoque y establecen una base para futuras investigaciones en traducción automática de LSA. Las contribuciones de este trabajo incluyen la creación de recursos fundamentales para el desarrollo de tecnologías de SLT en LSA y la implementación de modelos que sirven como referencia para investigaciones futuras. Estos avances buscan mejorar la comunicación y promover la inclusión de la comunidad sorda en Argentina.Magister en Inteligencia de Datos orientada a Big DataUniversidad Nacional de La PlataFacultad de Informátic

    Similar works