86 research outputs found

    Cálculo de frecuencias de aparición de fonemas y alófonos en español actual utilizando un transcriptor automático

    Get PDF
    The frequency of occurrence of the different phonemes of the Spanish language has been the subject of several previous studies. However, most of those studies did not take into account the frequency of the allophones, or they did it only partially (many times there was not even a phonetic transcription, and the plain orthographic transcription was used instead). Moreover, in all those previous works the frequency of occurrence was calculated from the transcription of isolated words, without taking into account the phonetic changes produced by its insertion in the speech chain, especially that of resyllabification. The present article calculates the frequency of occurrence of the phonemes and allophones of the Castilian Spanish dialect, as they are pronounced in the spoken language. The transcription of a corpus (consisting in 560 novels of modern Spanish writers) is done automatically thanks to a piece of software implemented for the purpose of this study. The article details the contents of the corpus as well as a detailed description of the design of the automatic transcriber. Finally, there is also a limited study of the syllable structure in terms of its type and frequency of occurrence.El cálculo de la frecuencia de aparición de los distintos fonemas de la lengua española es un asunto que se ha abordado previamente en varias ocasiones. Sin embargo, la gran mayoría de los estudios realizados no toma en consideración la variación alofónica o la trata solo parcialmente. Además, en todos estos trabajos los recuentos se han llevado a cabo a partir de palabras aisladas, sin tener en cuenta los fenómenos fonéticos que se producen en la secuencia fónica, especialmente el resilabeo. En el presente trabajo se realiza un recuento de los porcentajes de aparición de los distintos fonemas y alófonos en el dialecto castellano. Para ello, se ha creado un corpus de novelas en español, que se transcriben automáticamente con ayuda de un programa informático creado ex profeso, cuyo diseño se detalla en este artículo. También se realiza un estudio limitado de la estructura silábica en términos de frecuencias de aparición

    Revisão do módulo de transcrição fonética para implementação no sintetizador de fala da empresa Verbio Technologies SL

    Get PDF
    Dissertação de mest., Processamento de Linguagem Natural e Indústrias da Língua, Faculdade de Ciências Humanas e Sociais, Univ. do Algarve, 2013O objetivo deste trabanlho é contribuir para a melhoria da qualidade do sistema de conversão de texto em fala elaborado para o Português do Brasil e desenvolvido pela empresa Verbio Technologies SL. Tais modificações foram possíveis a partir da revisão minuciosa e das consequentes modificações no módulo de transcrição fonética do sintetizador. Devido às alterações introduzidas pela Nova Ortografia do Português foram feitas modificações nas regras de transformação dos grafemas em fonemas, parte integrante do transcritor fonético que compõe o sistema desenvolvido pela empresa. O novo acordo ortográfico consiste na reestruturação ortográfica da língua portuguesa, deste modo, muitas palavras sofreram modificações e, tais alterações deverão ser abarcadas pelo transcritor grafema-fonema do sistema de síntese de fala. Além das novas regras da ortografia portuguesa, também foi utilizado um dicionário desenvolvido pelo Centro de Pesquisa e Desenvolvimento em Telecomunicações (CPqD), versão 1.4 de maio de 2003. Este dicionário foi usado como ponto de partida para a definição dos fonemas e do subsequente desenvolvimento das novas regras. A metodologia de estudo consistiu na análise detalhada de duas variantes linguísticas do português brasileiro: a variante falada no Rio de Janeiro e a variante falada São Paulo, regiões economicamente desenvolvidas e onde a aplicação de um sintetizador se justica. Além da incorporação das novas regras de ortografia da língua portuguesa, foram definidas também algumas regras que contemplam determinados processos fonológicos frequentes no português brasileiro, como é o caso da epêntese vocálica

    Building a corpus of spoken Galician language. The CORILGA project

    Get PDF
    The CORILGA (Corpus Oral Informatizado de la Lengua Gallega) is a corpus of recordings aligned with their transcription and annotated at different levels (spelling, phonetic, morphological, syntactic...). A complete and thorough recordings and participants data allows, through an online open search engine, to get very accurate search results. This information could be used in language variation and change studies and to create materials for teaching or developing speech technology.El CORILGA (Corpus Oral Informatizado da Lingua Galega) es un corpus de grabaciones alineadas con su transcripción y anotadas en distintos niveles (ortográfico, fonético, morfológico…). Una codificación completa y minuciosa de los datos de las grabaciones y de los informantes permite, mediante un buscador online abierto al público, conseguir unos resultados de búsqueda muy precisos. Esta información se podría utilizar para la realización de estudios de variación y cambio lingüístico, así como para crear materiales para la enseñanza o desarrollar tecnologías del habla

    Sistema de texto-a-habla expresivo en español

    Get PDF
    En el presente trabajo se desarrolla un Sistema de Texto a Habla Expresivo en Español o TTS-EE que convierte una entrada de texto a un sonido de habla natural e inteligible y con emoción, simulando la interacción humana es decir una relación de comunicación entre una o más personas. Están involucrados en el desarrollo de este sistema programas como Python, MBROLA, eSpeak, el alfabeto fonético SAMPA, Easy Align e espeak. Se da un panorama general que va de lo histórico a lo más actual y también se describe detalladamente en qué consiste un Sistema de Texto a Habla. Una parte fundamental de este TTS-EE es la Transcripción ortográfica-fonética con la aplicación de reglas de acentuación, reglas de silabificación y reglas de transcripción basadas en SAMPA, se desarrollan módulos en código Python para tal fin. Además se realiza una síntesis de voz a través del sintetizador MBROLA y el desarrollo de código python para esta síntesis. Otra parte medular del TTS-EE es la creación de una base de datos de habla en español de México similar a una base de habla en español de España que ya se tiene, de las cuales se obtienen datos estadísticos de la duración y el pitch de cada fonema utilizado por medio de una segmentación con el programa PRAAT e Easy Align como herramientas. Se cuenta con un corpus del español del cual se obtuvo una tasa de sílabas por cada grupo de audios que se resumen en la Tabla 1 además de obtenerse una tasa de fonemas que se resumen en la Tabla 2. Finalmente se integra cada parte, la transcripción ortográfica-fonética, el sintetizdor MBROLA para obtener una voz con emoción a partir del texto de entrada pre-procesado, a través de la interfaz gráfica del TTS-EE

    New empirical data regarding the intonation of Spanish from the Glissando news corpus

    Get PDF
    El objetivo de este estudio es presentar nuevos datos empíricos sobre la entonación del español, a partir de los materiales anotados del subcorpus de noticias de Glissando, y discutir los datos desde la perspectiva de la distinción entre las categorías fonológicas representadas por el modelo Sp_ToBI y las realizaciones fonéticas que se hallan en un corpus leído.The goal of this paper is to present novel empirical data regarding the intonation ofSpanish, which have been collected from the annotated materials in the Glissandonews subcorpus, and to discuss the data from the perspective of the distinctionbetween the phonological categories represented by the Sp_ToBI model and thephonetic realizations that have been found in a corpus of read speech

    La Gramática castellana de Nebrija (1492): teoría y práctica de una reforma ortográfica

    Get PDF
    Este trabajo presenta un esbozo que no sólo permitirá apreciar la coincidencia del texto con la reforma proyectada, sino la posible divergencia entre tradición (tipo)gráfica e innovación teórica, así como la importancia de los aspectos silenciados en comparación con las necesidades coetáneas. Pero, atendiendo a la complejidad de los diversos aspectos que se acaban de enumerar, este primer artículo se limitará al estudio del alfabeto, dejando para los siguientes el examen de la palabra, de la oración y demás aspectos supra-oracionales

    The translator/interpreter’s intervention with regard to the interception of telecommunications in the Spanish police sphere: current situation and improvement suggestions

    Get PDF
    La traducción e interpretación en el ámbito policial es una especialidad poco conocida, y más aún el papel del intérprete en el desempeño de sus funciones en el marco de la interceptación de telecomunicaciones debido a su carácter altamente confidencial y poco reconocido. En el presente trabajo se investiga más a fondo esta especialidad de traducción e interpretación y se realiza un estudio de caso presentando una visión general teórica de la transcripción y traducción de las escuchas telecomunicativas sobre la base de la literatura existente –en gran parte norteamericana al existir pocos estudios españoles- lo que será contrastado, a través de la realización de una serie de entrevistas a intérpretes e inspectores profesionales, con la realidad del ámbito policial español. También se analizan los distintos tipos de transcripción y técnicas existentes, las habilidades necesarias y las actuales limitaciones del traductor-intérprete así como los programas informáticos actuales y aquellos que podrían facilitar la tarea del traductor. Todo lo anterior, con el fin de ofrecer un conocimiento más extenso sobre una materia poco estudiada en España y colaborar así en la mejora de este sector pensando en el traductor-intérprete y en su formación a través de cursos y seminarios de especialización.Translating and Interpreting for the police constitutes a little known speciality, notably the interpreter’s role when performing his duties within the telecommunication tapping framework due to the confidential and under-recognized nature of this work. This paper further investigates this translation and interpreting speciality and a case study is carried out in order to offer a theoretical general view about transcribing and translating telephone tapping material on the basis of the existing literature –mainly American literature because of the near absence of Spanish studies. The former will be contrasted with the reality of the Spanish police sphere on the basis of a series of interviews undertaken to professional interpreters and inspectors. Different types of transcription and existing techniques are also analysed, as well as the necessary skills and current limitations the translator/interpreter faces. Current computer software and near future programmes that may help the work of the interpreter are also analysed. All the above in order to offer a comprehensive knowledge about this little examined subject in Spain and in order to help to improve this sector thinking in particular of the translator/interpreter’s role and his training through diverse courses and seminars of specialization
    corecore