132 research outputs found

    Análisis de sentimientos de Cien años de soledad y El amor en los tiempos del cólera de Gabriel García Márquez

    Get PDF
    A las alturas de la segunda década de este nuevo milenio hay una verdad que no es desconocida: Una nueva sociedad y civilización se está construyendo. Esta nueva sociedad se está forjando sobre la base de las nuevas tecnologías de la información y la comunicación. En la actualidad y en un futuro todas estas tecnologías, para ejemplificar: un móvil o un ordenador, estarán presentes en todas las actividades y ámbitos tanto personales, académicos y laborales de la humanidad. Todo ello implica, forzosamente, una transformación de nuestra cosmovisión, de nuestras maneras de pensar, de hacer las cosas, de trabajar y de estudiar el mundo. Las humanidades, conocidas también como las ciencias humanas se han dedicado al estudio del lenguaje, la literatura, la educación, la historia, la música, la historia del arte, el cine, la lógica, la filosofía y la religión, entre muchos otros campos. Así, pues, se ha tenido la imagen de que los que nos dedicamos al estudio de cualquiera de estas disciplinas, por ejemplo: un filólogo o historiador, nos pasamos la vida encerrados en una biblioteca, leyendo vastas cantidades de libros, documentos o manuscritos; meditando y escribiendo. No obstante, hoy por hoy, parece ser que esa idea se está esfumando (o debería de ser así) puesto que cada vez somos más los humanistas que nos interesamos en incorporar de forma activa a los ordenadores como parte de nuestra actividad creativa, investigativa y docente.Departamento de Lengua EspañolaMáster en Estudios Filológicos Superiores: Investigación y Aplicaciones Profesionale

    Dificultades de comprensión lingüística oral, propuesta de mejora utilizando las nuevas tecnologías diálogo hombre-máquina mediante instrucciones expresadas en lenguaje natural

    Get PDF
    Tesis de la Universidad Complutense de Madrid, Facultad de Psicología, Departamento de Psicología Evolutiva y de la Educación, leída el 21-12-2001En esta tesis exponemos los elementos que intervienen en la comprensión lingüística. Nuestro recorrido abarca desde la encefalización hasta el estado más reciente de los Sistemas de Tecnología del Habla, detallando los modelos de especificación lingüística y gestión computacional actuales. Defendemos la hipótesis innatista del lenguaje y la prioridad semántica. Para probarlo realizamos pruebas con alumnos de Educación Secundaria, el grupo experimental presentaba dificultades de comprensión lingüística. Así mismo, mostramos el primer paso de cómo se origina el "arco reflejo de la comprensión lingüística artificial". Proponemos un modelo de procesamiento de la comprensión lingüística oral, y entre las conclusiones destaca el empleo de las mismas estrategias para comprender por parte de los dos grupos de alumnos, por lo tanto, en sujetos normales la comprensión sería cualitativamente igual, además, constatamos que corresponde al analizador semántico las mejores prestaciones en tecnología del habla. Finalmente, creamos una propuesta para mejorar la comprensión lingüística oral mediante las nuevas tecnologías.Sección Deptal. de Investigación y Psicología en Educación (Psicología)Fac. de PsicologíaTRUEpu

    Aproximación a la lingüística computacional

    Get PDF
    520 p.Esta tesis surge con el objetivo de intentar dar respuesta, desde la perspectiva de la Lingüística, a una serie de preguntas básicas planteadas a raíz de una primera toma de contacto con el campo de la Lingüística Computacional. En primer lugar, buscando delimitar el objeto, finalidad, líneas de investigación e historia de la disciplina. En segundo lugar, analizando las implicaciones del tratamiento computacional del lenguaje a través de sus principales áreas de trabajo, así como algunas de las aplicaciones de la LC. Por último, incidiendo en uno de los aspectos que más interés han suscitado, el de la recopilación de grandes muestras textuales de uso de la lengua, o corpus. Todos estos puntos se han articulado en sendos materiales en línea que sirven desde hace algunos años como apoyo de la docencia de las asignaturas correspondientes de la licenciatura en Lingüística y que son de consulta libre para todos aquellos que quieran utilizarlo

    Síntesis de voz aplicada a la traducción voz a voz

    Get PDF
    In the field of speech technologies, text-to-speech conversion is the automatic generation of artificial voices that sound identical to a human voice when reading a text in loud speech. Inside a text-to-speech system, the prosody module produces the prosodic information that is necessary to generate a natural voice: intonational phrases, intonation of the sentence, duration and energy of phonemes, etc. The correct generation of this information directly impacts in the naturalness and expressiveness of the system. The main goals of this thesis is the development of new algorithms to train models for prosody generation that may be used in a text-to-speech system, and their use in the framework of speech-to-speech translation. In this thesis several alternatives were studied for intonation modeling. They combine the parameterization and the intonation model generation as a integrated process. Such approach was successfully judged both with objective and subjective evaluations. The influence of segmental and suprasegmental factors in duration modeling was also studied. Several algorithms were proposed with the results of these studies that may combine segmental and suprasegmental information, likewise other publications of this field. Finally, an analysis of various phrase break models was also performed, both with words and accent groups: classification trees (CART), language modeling (LM) and finite state transducers (FST). The use of the same data set in the experiments was useful to obtain relevant conclusions about the differences between these models. One of the main goals of this thesis was the improvement of naturalness, expressiveness and consistency with the style of the source speaker in text-to-speech systems. This may be done by using the prosody of the source speaker in the framework of speech-to-speech translation as an additional information source. Several algorithms were developed for prosody generation that may integrate such additional information for the prediction of intonation, phoneme duration and phrase breaks. In that direction several approaches were studied to transfer the intonation from one language to the other. The chosen approach was an automatic clustering algorithm that finds a certain number of tonal movements that are related between languages, without any limitation about their number. In this way, it is possible to use this coding for intonation modeling of the target language. Experimental results show an improvement, that is more relevant in close languages, such as Spanish and Catalan. Although no segmental duration transfer was performed between languages, in this thesis is proposed the transfer of rhythm from one language to the other. For that purpose a method that combines the rhythm transfer and audio synchronization was proposed. The synchronizations is included because of its importance for the speech-to-speech translation technology when video is also used. Lastly, in this thesis was also proposed a pause transfer technique in the framework of speech-to-speech translation, by means of alignment information. Studies in training data have shown the advantage of tuples for this task. In order to predict any pause that can not be transferred using the before mentioned method, conventional pause prediction algorithms are used (CART, CART+LM, FST), taking into account the already transferred pauses.Dentro de las tecnologías del habla, la conversión texto a voz consiste en la generación, por medios automáticos, de una voz artificial que genera idéntico sonido al producido por una persona al leer un texto en voz alta. En resumen, los conversores texto a voz son sistemas que permiten la conversión de textos en voz sintética. El proceso de conversión texto a voz se divide en tres módulos básicos: procesamiento del texto, generación de la prosodia y generación de la voz sintética. En el primero de los módulos se realiza la normalización del texto (para expandir abreviaciones, convertir números y fechas en texto, etc), y en ocasiones, luego también se hace un etiquetado morfosintáctico. A continuación se procede a la conversión de los grafemas en fonemas y a la silabificación para obtener la secuencia de fonemas necesaria para reproducir el texto. Posteriormente, el módulo de prosodia genera la información prosódica para poder producir la voz. Para ello se predicen las frases entonativas y la entonación de la oración, y también la duración y la energía de los fonemas, etc. La correcta generación de esta información repercutirá directamente en la naturalidad y expresividad del sistema. En el último modulo de generación de la voz es donde se produce la voz considerando la información provista por los módulos de procesamiento del texto y prosodia. El objetivo de la presente tesis es el desarrollo de nuevos algoritmos para el entrenamiento de modelos de generación de prosodia para la conversión texto a voz, y su aplicación en el marco de la traducción voz a voz. En el caso de los algoritmos de modelado de entonación, en la literatura se proponen generalmente enfoques que incluyen una estilización previa a la parametrización. En esta tesis se estudiaron alternativas para evitar esa estilización, combinando la parametrización y la generación del modelo de entonación en un todo integrado. Dicho enfoque ha resultado exitoso tanto en la evaluación objetiva (usando medidas como el error cuadrático medio o el coeficiente de correlación Pearson) como en la subjetiva. Los evaluadores han considerado que el enfoque propuesto tiene una calidad y una naturalidad superiores a otros algoritmos existentes en la literatura incluidos en las evaluaciones, alcanzando un MOS de naturalidad de 3,55 (4,63 para la voz original) y un MOS de calidad de 3,78 (4,78 para la voz original).Postprint (published version

    Métodos de selección léxica aplicados a la enseñanza. El vocabulario fundamental del español

    Get PDF
    [ES]El objetivo principal de este trabajo es hallar un método de selección y unión del léxico frecuente y el disponible para la elaboración del vocabulario fundamental. Para ello estudiamos ambas líneas de trabajo, los listados de frecuencia léxica derivados de la lingüística del corpus y los estudios sobre disponibilidad léxica, con la intención de entender cuáles son sus resultados y las unidades léxicas a las que llegamos en cada caso. Consideramos que la aplicación principal de este vocabulario fundamental es la enseñanza-aprendizaje de español como lengua extranjera, con lo que en los dos primeros capítulos estudiamos cuestiones relacionadas con ella y con las características del vocabulario, la competencia léxica, los métodos y enfoques didácticos, etc. Como el marco en el que se encuadra la elaboración de un vocabulario fundamental es la selección léxica, estudiamos los principales modelos que existen y cómo se suele llevar a cabo en la práctica. Por nuestra parte, nos centramos en los métodos objetivos de selección léxica, ya que en todo momento buscamos criterios científicos además de eficaces. Lo conseguimos gracias a procedimientos estadísticos y matemáticos. Para determinar el número de palabras que son recomendables para cada nivel del Marco común europeo de referencia para las lenguas, recurrimos a estudios sobre los porcentajes de cobertura léxica de las voces frecuentes, los resultados sobre la comprensión textual en estudiantes de inglés como lengua extranjera y la hipótesis sobre la existencia de un umbral léxico necesario para que se dé la comprensión oral y escrita de modo óptimo. Con ello establecemos un intervalo de unidades que se deben enseñar en cada nivel de lengua. Finalmente, determinamos el número de palabras que debe tener el vocabulario fundamental (orientado a un nivel B1 del Marco) y los parámetros para seleccionar los términos más usuales y los más disponibles, que obtenemos de tres obras fijadas previamente: un listado con las 5.000 palabras más frecuentes y dos listados de disponibilidad léxica de diferentes características. El resultado es el vocabulario fundamental del español, cuyo esbozo acompañamos de una definición del concepto y una historia de sus orígenes y anteriores propuestas

    IV Congreso de Lingüística General. Cádiz, del 3 al 6 de abril de 2000. Vol. II

    Get PDF
    Durante los días 3 al 6 de abril del año 2000 tuvo lugar en la Universidad de Cádiz el IV Congreso de Lingüística General, organizado por el área de Lingüística General de esta Universidad.893 págs

    La traducción automática dentro del contexto de una lengua minorizada. ¿Qué tipo de motor se adapta mejor al caso especial del gallego?

    Get PDF
    El present treball de fi de màster té com a objectiu avaluar la percepció d'adequació de tres tipus diferents de motors de traducció automàtica dins el context d'una llengua minoritzada. El treball parteix de l'anàlisi teòrica de la relació existent entre traducció automàtica i llengües minoritzades, centrant-se específicament en el parell d'idiomes avaluat, espanyol-gallec. Per realitzar aquesta avaluació, s'empra un disseny mixt amb tres mètodes diferents (BLEU, enquesta i anàlisi d'errors) per extreure dades quantitatives i qualitatives sobre un text de màrqueting de l'àmbit elèctric traduït amb un motor basat en regles, un motor estadístic i un motor neuronal. Un cop realitzada cada avaluació per separat, es triangulen els resultats per determinar quin motor proporciona millors resultats. Finalment, a partir de l'anàlisi de les dades, s'extreu una sèrie de conclusions que confirmen o refuten les hipòtesis de partida.El presente trabajo de fin de máster tiene como objetivo evaluar la percepción de adecuación de tres tipos diferentes de motores de traducción automática dentro del contexto de una lengua minorizada. El trabajo parte del análisis teórico de la relación existente entre traducción automática y lenguas minorizadas, centrándose específicamente en el par de idiomas evaluado, español-gallego. Para realizar dicha evaluación, se emplea un diseño mixto con tres métodos distintos (BLEU, encuesta y análisis de errores) para extraer datos cuantitativos y cualitativos sobre un texto de marketing del ámbito eléctrico traducido con un motor basado en reglas, un motor estadístico y un motor neuronal. Una vez realizada cada evaluación por separado, se triangulan los resultados para determinar qué motor proporciona mejores resultados. Finalmente, a partir del análisis de los datos, se extrae una serie de conclusiones que confirman o refutan las hipótesis de partida.The aim of this master's degree Dissertation is to assess the perception of adequacy of three different types of machine translation engines within the context of minoritized languages. The Dissertation is based on the theoretical analysis of the relationship between machine translation and minoritized languages, with special focus on the assessed pair of languages, Spanish-Galician. To perform this evaluation, a mixed design with three different metrics (BLEU, survey and error analysis) is used to extract quantitative and qualitative data about a marketing text from the electric field translated with a rule-based engine, a phrase-based engine and a neuronal engine. Once each evaluation is individually conducted, the results are triangulated to determine which engine provides the best results. Finally, based on the data analysis, a number of conclusions is extracted to confirm or refute the starting hypotheses

    Un enfoque léxico a prueba: efectos de la instrucción en el aprendizaje de las colocaciones léxicas

    Get PDF
    [ES]Las colocaciones léxicas (dar un paseo, contar una historia) han conseguido una gran atención como tema de investigación en campos como la adquisición de segundas lenguas (e.g. Schmitt, 2004; Meunier y Granger, 2008; Wood, 2010) así como en pedagogía de segundas lenguas (e.g. Lewis, 1993; Boers et al., 2006). Se ha demostrado que la adquisición de las colocaciones resulta problemática para aprendientes de L2 adultos (Nesselhauf, 2005) por varias razones, como la incongruencia con la L1, su falta de prominencia en los textos, su frecuente carácter idiomático, su posible carácter discontinuo, su aparente arbitrariedad y el hecho de que en algunos casos estén formadas por palabras ya conocidas. Por todas estas razones pueden pasar desapercibidas en la recepción del input y se requieren muchos encuentros en un período breve de tiempo para poder aprenderlas. En contextos de aprendizaje sin inmersión, las posibilidades de que esto ocurra son mínimas. Como consecuencia, algunos expertos en didáctica del léxico han recomendado la práctica de la captación de las colocaciones o noticing como el centro de la práctica pedagógica referida a las unidades léxicas complejas (Lewis, 1993, 1997, 2000). Otros, sin embargo, han abogado por la efectividad de las actividades explícitas no insertadas en los textos para promover un aprendizaje explícito e intencional de colocaciones previamente seleccionadas (e.g. Laufer y Girsai, 2008; Peters, 2009, 2012). No obstante, hasta donde sabemos, existe escasa evidencia empírica disponible ¿y menos aún para el español como L2 o LE¿ para decidir qué método promueve un mayor aprendizaje de las colocaciones. En esta tesis presentamos los resultados de un estudio de aula que contribuye a llenar este vacío aplicando las dos metodologías en grupos distintos, para después comparar los resultados en ambos grupos. El último objetivo es decidir qué metodología presenta más beneficios y ganancias para los aprendientes. Además, una de las razones a las que en la bibliografía se suele aludir para explicar la dificultad que oponen las colocaciones a los aprendientes de L2 es que no llaman la atención en el input porque no plantean problemas de comprensión. Así, cuando un aprendiente de ELE lee en un texto dé un paseo todos los días, no repararía en que es el verbo dar el que se combina con paseo, pudiendo cometer errores de transferencia en la producción como tomar un paseo ¿si su L1 es el inglés¿ o hacer un paseo ¿si su L1 es el francés-. Sin embargo, no tenemos noticia de ningún estudio que compare el aprendizaje de estas construcciones con verbo de apoyo (Alonso Ramos, 2004) frente a otro tipo de colocaciones en aprendientes de ELE, lo que nos lleva a tratar de responder a esta pregunta en nuestro estudio empírico. Para abordar estos objetivos de investigación diseñamos y llevamos a cabo un estudio experimental en el que se contó con tres grupos, dos experimentales y uno de control. Los tres grupos estuvieron expuestos al mismo input, que se trató de forma diferente. En el grupo de control, el vocabulario se abordó al nivel de la palabra y en su dimensión paradigmática; en el grupo experimental de captación se creó conciencia de las colocaciones y se llamó la atención sobre ellas en el input, animando a que los aprendientes las registraran en sus cuadernos; en el grupo experimental de tratamiento explícito también se creó conciencia de las colocaciones asignando actividades sobre las aparecidas en el input pero con tareas no insertadas en los textos. El tratamiento se implementó dos veces, una en el semestre de otoño y otra en el semestre de primavera durante un período de 8 semanas con 3 sesiones de clase de 75 minutos por semana. Participaron un total de 52 estudiantes de español L2 de la Universidad de Columbia y Barnard. Sus habilidades para el reconocimiento activo de las colocaciones antes y después del tratamiento didáctico se midieron a través de la administración de un pretest y 3 postest, uno al final de cada unidad didáctica. Además, al final del estudio, se administró un cuestionario en los dos grupos experimentales para valorar, de forma cualitativa, las percepciones y actitudes ante los materiales y la metodología seguida. A la luz de los resultados, podemos concluir que (1) la captación de las colocaciones en el input y la realización de actividades explícitas contribuyen al desarrollo de habilidades para su reconocimiento activo, mientras que la exposición a ellas en el input no genera aprendizaje alguno; (2) las ganancias de aprendizaje que se producen a través de la realización de actividades son significativamente mayores a las que se producen a través de la captación; (3) no hay diferencias entre las ganancias de aprendizaje de construcciones con verbo de apoyo y otras colocaciones después de los tratamientos de captación e instrucción explícita; (4) la creación de conciencia de las colocaciones a través de la realización de actividades genera la habilidad de captación de otras colocaciones en el input

    Multidisciplinary analysis of the phenomenon of phraseological variation in translation and interpreting

    Get PDF
    Número especial 6 (2020). Análisis multidisciplinar del fenómeno de la variación en traducción e interpretación / Multidisciplinary analysis of the phenomenon of phraseological variation in translation and interpreting. Pedro Mogorrón Huerta (Ed.)Special Issue 6 (2020). Multidisciplinary analysis of the phenomenon of phraseological variation in translation and interpreting /Análisis multidisciplinar del fenómeno de la variación en traducción e interpretación. Pedro Mogorrón Huerta (Ed.
    corecore