416 research outputs found

    Estrategias para la mejora de la naturalidad y la incorporación de variedad emocional a la conversión texto a voz en castellano

    Full text link
    En esta Tesis se abordan tres subproblemas relacionados con la variedad y la naturalidad en la conversión texto habla en castellano: el procesado lingüístico orientado a prosodia, el modelado de la frecuencia fundamental en un dominio restringido y el análisis, modelado y conversión texto a voz con emociones. El capítulo del estado de la cuestión recoge con detalle los principales progresos en cada módulo de un conversor. El primer apartado destacable está dedicado al análisis gramatical y sintáctico, cubriendo las técnicas de normalización del texto, los corpora anotados, las bases de datos léxicas disponibles en castellano, las técnicas de desambiguación contextual y de análisis sintáctico y los sistemas disponibles en castellano. En cuanto al modelado prosódico, se tratan los modelos empleados tanto para la frecuencia fundamental como el ritmo, las duraciones y el pausado, las principales escuelas de análisis de la curva de frecuencia fundamental y las técnicas avanzadas de diseño de las bases de datos. En el apartado dedicado a la voz emotiva se describen y comentan los principales sistemas internacionales desarrollados y las bases de datos disponibles. Como en general la síntesis por formantes ha dominado este campo, se describe esta técnica, para finalizar con una revisión de las alternativas de evaluación empleadas en síntesis de voz con emociones. En el capítulo dedicado a las investigaciones en procesado lingüístico del texto se comienza describiendo en detalle los corpora empleado en la experimentación, tanto en normalización como en etiquetado. La técnica desarrollada en normalización emplea reglas de experto, con muy buenos resultados tanto en precisión como en cobertura, destacando el empleo de reglas de silabicación para la detección precisa de palabras extranjeras. Al afrontar la desambiguación gramatical, se comparan tres técnicas: reglas de experto, aprendizaje automático de reglas y modelado estocástico, obteniéndose los mejores resultados con esta última técnica, debido a su capacidad de procesar más adecuadamente textos fuera del dominio de entrenamiento. Finalmente se aborda el análisis sintáctico por medio de gramática de contexto libre como un proceso en dos fases:, una primera sintagmática y una segunda relacional básica, a fin de maximizar la cobertura del análisis. Para la resolución de las ambigüedades que nos permiten alcanzar gran cobertura se adapta el principio de mínima longitud de descripción con notables resultados. Las gramáticas desarrolladas se encuentran comentadas y ejemplificadas en un apéndice. Para el modelado de F0 en un dominio restringido se emplean perceptrones multicapa. En una primera etapa se describe y evalúa una nueva técnica de diseño de base de datos basada en un algoritmo voraz moderado mediante subobjetivos intermedios. La exhaustiva experimentación con los diversos parámetros de predicción, la configuración de la red y las subdivisiones de la base de datos ocupa la mayor parte del capítulo, destacando la aportación de un parámetro específico del dominio restringido (el número de la frase portadora del texto que sintetizar) junto a otros más clásicos (acentuación, tipo de grupo fónico y posición en el mismo). El capítulo dedicado a la voz emotiva comienza detallando el proceso de creación de una nueva voz castellana masculina en síntesis por formantes con modelo mejorado de fuente (reglas y metodología), evaluando las posibilidades de personalización de voz que ofrece. Para trabajar con voz con emociones se diseña, graba y etiqueta una base de datos de voz en la que un actor simula tristeza, alegría, sorpresa, enfado y también una voz neutra. Por medio de técnicas paramétricas (modelo de picos y valles en tono, y multiplicativo en las duraciones) se analiza prosódicamente la base de datos y se establece una primera caracterización de la voz en las distintas emociones. Empleando como base la voz personalizable se desarrolla el sistema completo de conversión texto a voz con emociones y se evalúa, destacando la rápida adaptación de los usuarios en cuanto a la identificación de la emoción expresada. Finalmente se experimenta con síntesis por concatenación y síntesis por copia, llegando a las siguientes conclusiones: la voz sorprendida se identifica prosódicamente, las características segmentales son las que caracterizan al enfado en frío; y, finalmente, la tristeza y la alegría son de naturaleza mixta

    La variabilidad lingüística nativa y no nativa en escenarios comunicativos. La función de transacción en una situación cotidiana: corpus y descripción para el español (L1/LE)

    Get PDF
    [spa] En este trabajo de tesis se realiza un estudio de corte empírico de la lengua hablada, sobre el análisis de un escenario comunicativo real: transacción de información y compra-venta de billetes en el ámbito del transporte en tren. Se trata de describir el contenido funcional, nocional (léxico) y sociopragmático más significativo, con la objetivo final de proponer la descripción de un inventario básico de la lengua oral en la función de transacción de información y compra-venta de billetes de tren, para enseñar y aprender en los niveles B1-B2 del Marco Común Europeo de Referencia (MCER) (Consejo de Europa 2001), sin especificar ninguna metodología de enseñanza. El método de obtención de datos es a partir del corpus FerroviELE, creado específicamente para esta tesis doctoral con la participación de informantes universitarios que estudiaban español como lengua extranjera en los niveles B1 y B2 (MCER) y no discentes, y por hablantes nativos de edades, sexos y niveles socioculturales diferentes (N=100). FerroviELE está formado por cinco subcorpus que corresponden a tres metodologías distintas de obtención de los diálogos. Cada subcorpus se ha transcrito ortográficamente y se ha anotado morfológica y pragmático-funcional con su correspondiente guía de anotación. En esta guía se reelabora el repertorio de las funciones comunicativas, disponibles en el MCER y basadas en los descriptores del Vantage Level (van Ek y Trim 2001) y el Core Inventory de EAQUALS y el British Council (North et al. 2010). Igualmente, se presenta el conjunto de etiquetas que constituyen las nociones léxicas, que son el resultado del refinamiento de las propuestas para el español del Plan Curricular del Instituto Cervantes (B1, B2). Además se incluye la descripción de la anotación morfosintáctica. De lo analizado empíricamente se obtienen repertorios de carácter pragmático y estratégico-cognitivo, sistematizados por niveles de competencia en una destreza comunicativa, la oral. Estos repertorios constituyen una importante aportación al campo de la enseñanza y aprendizaje en E/LE y servirán para inspirar otros trabajos similares o aplicaciones didácticas con vistas a mejorar los materiales docentes de la enseñanza en el área de E/LE.[eng] This dissertation consists of an empirical study of spoken language based on the analysis of a real communicative setting, namely information transaction and ticket purchase in the field of railway transport. Its description of the most significant functional, lexical and socio-pragmatic contents aims to outline a proposal for a core inventory of the language involved in the above mentioned oral communicative situation, to be applied in the learning and teaching of Spanish as a foreign language, levels B1 and B2 in the Common European Framework of Reference for Languages (CEFR) (Council of Europe, 2001), although no specific methodology is proposed. Data were collected from FerroviELE, a corpus created for this thesis. The participants in this corpus include university students learning Spanish as a foreign language at levels B1 and B2 (CEFR), as well as native speakers of Spanish of different ages, gender and socio-cultural backgrounds (N=100). FerroviELE comprises five subcorpora of dialogues obtained by means of three different methodologies. Every subcorpus was transcribed and annotations on morphology and the pragmatic functions found were made according to the corresponding annotation guide. In this guide, the repertoire of communicative functions in CEFR is re-elaborated on the basis of the descriptors in the Vantage Level (van Ek y Trim 2001) and the Core Inventory by EAQUALS and British Council (North et al. 2010). In addition, the labels of the lexical notions, resulting from the refinement of those in the proposal in the Plan Curricular del Instituto Cervantes (B1, B2), are presented. A description of the morphosyntactic annotation is also included. The inventories resulting from the empirical analysis are pragmatic and strategic-cognitive. They are systematized according to the level of the oral communicative skills. Therefore, they could contributive greatly to the field of Spanish as a foreign language learning and teaching, inspiring future studies and didactic applications aimed at improving learning and teaching materials in this field

    Difusión noticiosa y medios sociales: un análisis de contenido a la difusión de temas noticiosos del periódico El Tiempo en Twitter durante el año 2013

    Get PDF
    El ejercicio del periodismo ha ido cambiando de escenario conforme avanzan las décadas. Es por esto que el presente estudio busca aportar, más que un recorrido teórico, herramientas metodológicas para abordar la situación actual de los medios de difusión de noticias y su relación con el social media. Con un enfoque cuantitativo, este trabajo de investigación utiliza la Teoría de la Difusión de Innovaciones como base para el estudio de la difusión de tópicos noticiosos en la cuenta de Twitter del periódico colombiano El Tiempo (@ElTiempo), y las nociones principales sobre Big Data, análisis automatizado de contenido, data mining, machine learning, modelado de tópicos y análisis de sentimiento automatizado para comprender las características, relaciones y posibles causas de las dinámicas de difusión presentes en los datos. Se pudo inferir que la cuenta @ElTiempo tiene un bajo índice de contenidos replicados en su perfil, mensajes propios relativamente cortos y gran cantidad de enlaces que dirigen a los usuarios a otros sitios web. Se da, además, poca inserción de estos mensajes en conversaciones a través de etiquetas. Los principales tópicos subyacentes encontrados estuvieron enfocados en temas políticos y de interés nacional, deportes e internacionales y se detectó una relación entre los perfiles más mencionados, las palabras claves y los tópicos subyacentes, puesto que los resultados de estos tres ítems encajan en las categorías de política o deportes.MaestríaMagister en Comunicació

    Análisis del discurso de las voces del Beisbol Panameño

    Get PDF
    El proyecto análisis del discurso de las voces del béisbol panameño explica el código lingüístico utilizado en este campo deportivo, al cual se le realizó un estudio pragmático, retórico y técnico para darle las diferentes connotaciones a los términos o frases utilizadas por los jugadores, instructores y público que participa en los juegos. Es una investigación de campo realizada en el 2014, tomando como referenda la temporada mayor, específicamente los juegos de Bocas del Toro. Para ello, fue necesaria la grabación de cinco juegos televisados, cinco transmitidos por tres emisoras diferentes, convivencia con fanáticos en los estadios y en lugares donde se transmitían juegos de Bocas del Toro. De estas grabaciones y convivencias se obtuvo el corpus (cuerpo: frases para analizar) para la realización de la investigación. Se analizaron 138 frases utilizadas por los narradores y 100 por los espectadores. Los resultados presentan un cuadro comparativo que permitirá al lector tener una visión generalizada del concepto que puede tener dicha frase en tres áreas distintas: según la utilización del lenguaje, la intención del emisor y el tecnicismo del deporte; además, la investigación presenta la clasificación de las frases según el nivel de la lengua. Las frases de los espectadores se analizaron según la belleza del lenguaje y la intención con la que emitían los términos

    Corpus de Habla Infantil Espontánea del Español

    Full text link
    Tesis inédita leída el 25-02-2008 en la Universidad Autónoma de Madrid, Facultad de Filosofía y Letras, Departamento de Lingüística General y Teoría Literari

    Diseño de estrategias innovadoras para fomentar el hábito lector en estudiantes de educación primaria del colegio San Agustín - Chiclayo

    Get PDF
    En esta investigación se busca fortalecer el hábito lector en los estudiantes del nivel primario mediante estrategias innovadoras amenas y dinámicas que cubran sus necesidades e intereses y garanticen el placer por la lectura. Con esta finalidad se aplica el enfoque socio cognitivo que permitirá contextualizar sus aprendizajes en el medio en el que se desenvuelve. Para ello, se desarrolla el Proyecto titulado “Lectores Agustinos en marcha” que promueve la integración de la biblioteca escolar con las actividades del Plan lector Institucional y la familia, en el intento de que se potencien las capacidades en los diferentes lenguajes: plástico, sonoro, gestual, corporal, oral o escrito y se desarrollen oportunidades de descubrimiento autónomo y del establecimiento de relaciones interpersonales basadas en el respeto, la seguridad afectiva y física. El diseño que se tomó para esta investigación es experimental con una población de 400 alumnos de 2.º a 5.º grado de primaria de la Institución Educativa “San Agustín” Chiclayo, finalizando con una encuesta que nos permitió evaluar la eficacia de la propuesta y evidenciar los efectos de un hábito lector a través de la expresión oral, comprensión y producción de textos como lo muestran los resultados de las pruebas censales, por lo que esta experiencia a través de los años se ha convertido en una política lingüística institucional

    Estrategias interactivas de producción de textos literarios para estudiantes del quinto grado de educación general básica de la unidad educativa “Atahualpa” del cantón Ibarra

    Get PDF
    Proponer estrategias interactivas de producción de textos literarios para estudiantes del quinto Grado de Educación General Básica de la Unidad Educativa “Atahualpa” del cantón Ibarra.El presente estudio tiene como propósito realizar un análisis de las estrategias de la lecto-escritura que tiene el currículo vigente y proponer estrategias innovadoras para mejorar la lectura en la institución educativa. La importancia de la misma radica en ofrecer un programa de estrategias educativas, que sirva a la comunidad educativa enmarcada dentro de un eje transversal como es la educación práctica de la Reforma Curricular vigente por el Ministerio de Educación. La Institución seleccionada posee las características ideales para el desarrollo del programa curricular que posibilite la aplicación de metodologías, que permita rediseñar el currículo general El plantel se halla ubicado en el cantón Ibarra, provincia de Imbabura un núcleo poblado muy fuerte con una alta densidad poblacional en las parroquias y comunidades aledañas. Los objetivos planteados, la metodología empleada fue la cuantitativa a través de encuestas estructuradas para determinar la aplicabilidad de estrategias interactivas de lecto escritura, Como conclusiones de esta investigación se obtiene que los estudiantes carecen de un conocimiento estratégico en cuanto a la lecto escritura. En la construcción de textos literarios el docente poco aplica destrezas que apoyen a la lectura comprensiva, por lo que la propuesta de metodología para construir textos apoyen las iniciativas de los docentes y el Ministerio de Educación promueva la capacitación en el referente literario. Las instituciones educativas deben promocionar con los estudiantes prácticas de creación de textos literarios concursos y propuestas donde el docente se inserte para adquirir hábitos de destrezas y creación de obras literarias

    La investigación en curso : resúmenes. 2014-2015

    Get PDF
    Se reúnen en este volumen las investigaciones actualmente en curso en la Facultad de Lenguas, correspondientes al período 2014-2015. Con esta propuesta damos continuación a la iniciativa de la Dra. Magdalena Viramonte de Ávalos, quien siendo Directora del CIFAL, publicó, en 2011, La Investigación en curso. Resúmenes. El propósito fundamental de esta publicación es socializar el estado de la investigación en la Facultad de Lenguas. Hemos incluido los proyectos de los/as directores/as que oportunamente respondieron a nuestro llamado. Abre el volumen una encuesta de la Dra. Cristina Dalmagro en relación con las áreas que integran el CIFAL. A continuación, un proyecto perteneciente a la Dra. Marta Palacios estudia la producción científica en la Facultad de Lenguas en el periodo 2008-2013. A excepción de este caso, los proyectos están agrupados conforme a las áreas que constituyen el CIFAL

    La kinésica en la conversación coloquial del español de Bogotá

    Get PDF
    Doctorado en Ciencias del Lenguaje con mención en Lingüística AplicadaFil: Suárez Reina, Adriana Yamile. Universidad Nacional de Córdoba. Facultad de Lenguas; Argentina.La presente investigación aborda el estudio de los gestos en co-ocurrencia con el habla en las conversaciones coloquiales de un grupo de jóvenes universitarios de la ciudad de Bogotá. A partir de los estudios de McNeill (1985), se considera que los gestos no existen separadamente del lenguaje pues son una ventana al pensamiento. Aunque estos tienen diferentes sistemas de procesamiento, no son un accesorio del lenguaje, sino que hacen parte de un todo integrado facilitador de la comprensión del acto comunicativo. De acuerdo con ello, el objetivo fundamental del trabajo se orientó hacia la caracterización de los gestos en la conversación coloquial y la discusión de su naturaleza en la construcción del significado. La hipótesis consistió en que los gestos presentes en la conversación coloquial reflejan diversos modos de configurar el significado más allá de establecerse desde la generalización de repetir, contradecir, sustituir, complementar, acentuar o regular la comunicación verbal. Teniendo en cuenta esta mirada, se optó por un tipo de investigación mixto no experimental con un diseño transversal y de alcance descriptivo para identificar el papel de los gestos en el grupo estudiado. Los resultados evidenciaron que los gestos más usados por la población participante fueron los deícticos e icónicos. El primer tipo de gestos estaba en el plano de lo abstracto, razón por la cual los hablantes hacían uso de ellos a través de acciones corporizadas para hacer dichos términos más comunicables y comprensibles. El segundo grupo daba cuenta del proceso de pensamiento de los hablantes. Este grupo daba forma a cómo se estaba comprendiendo la idea a través de una experiencia de movimiento, es decir, la elaboración de pensamiento se interrelaciona con sus formas gestuales. Finalmente, se demuestra que los gestos presentes en la conversación coloquial de los jóvenes universitarios dan cuenta de la manera a través de la cual se configura el significado en tanto que es gracias a los gestos que las ideas abstractas pueden volverse físicas a través de la corporeización de información espacial, así como información temporal aportada a la representación esquemática de los conceptos usados.Fil: Suárez Reina, Adriana Yamile. Universidad Nacional de Córdoba. Facultad de Lenguas; Argentina

    Análisis y explicación de los actos de habla en el marco del discurso jurídico: una perspectiva pragmática

    Get PDF
    El presente proyecto de grado está enfocado en el reconocimiento, la comparación y el análisis de los actos de habla y los infortunios presentes en el discurso jurídico, específicamente dentro de la celebración de un juicio oral, entendido éste, desde las instancias judiciales como homicidio, tráfico y porte ilegal de armas, en el cual pretendemos realizar la detección de los elementos referenciados, con el fin de evidenciar en los discursos, las marcas o rasgos distintivos con las que son diseñadas cada una de las emisiones realizadas por los actores implicados dentro del contexto tales como: Juez, abogado, fiscal y testigos. Para llevar a cabo dicha inmersión y análisis se hace necesario acudir a las teorías expuestas por los siguientes autores: John Austin, John Searle, María Victoria Escandell y Paul Grice; los cuales ofrecen una visión pragmática determinante y pertinente para el estudio del caso. Es precisamente a través de los postulados teóricos de estos autores, como se pretenden hacer explícitas cada una de las marcas con las que están impregnados los distintos actos de habla proferidos por dichos actores
    corecore