19 research outputs found
Étude comparée de quatre paramètres acoustiques des occlusives en espagnol de Buenos Aires et en français de Montréal
Cette étude compare le rendement de quatre paramètres acoustiques contribuant aux distinctions de voisement et de lieu d’articulation, soit le VOT, la durée de la tenue, les transitions de F2 et de F3 de la voyelle suivante, dans les occlusives de l’espagnol parlé à Buenos Aires et dans celles du français parlé à Montréal. Il en ressort que seul le VOT fonctionne de la même façon et a un rendement équivalent dans les deux parlers. Le rendement de la durée de la tenue dans la distinction sourde-sonore est également important dans le parler espagnol, mais faible dans le parler français. En ce qui a trait à la distinction des lieux d’articulation, il appert que la transition de F2 joue un rôle plus important dans le parler français que dans le parler espagnol, alors que c’est l’inverse dans le cas de la transition de F3. Ainsi, lorsque les mêmes indices coutribuent à une même opposition phonologique dans deux idiomes distincts, leur mode d’association est différentThis study compares the efficiency of two acoustic cues of voicing—VOT and the duration of the silent interval—and of two acoustic cues of place of articulation—the initial frequency of F2 and F3 of the following vowel—in the stop consonants of Spanish spoken in Buenos Aires and French spoken in Montreal. The findings are that only VOT works in the same way in both idioms. The duration of SI has an important output as well in the distinction of voicing in the Spanish idiom, but has a low efficiency in French. Concerning the distinction of places of articulation, the findings are that the efficiency of the F2 transition is greater in French than in Spanish and, on the contrary, the F3 transition has a greater output in Spanish. When the same cues contribute to the same phonological oppositions in two different languages, their manner of combination can differ
AMPER-Argentina: tonemas en oraciones interrogativas absolutas
Se analizan acústicamente los tonemas en oraciones interrogativas absolutas sin expansión. El corpus está integrado por emisiones SVO (SN + SV + SPrep). El SN tiene acentos tonales y acentos léxicos dentro de palabras paroxítonas (La guitarra), proparoxítonas (La cítara) y oxítonas (El saxofón). El SV es común a todas las emisiones: se toca. El SPrep tienen acentos tonales y acentos léxicos en palabras paroxítonas (con paciencia), en palabras proparoxítonas (con pánico) y en palabras oxítonas (con obsesión). Los corpus son emisiones de dos informantes femeninos sin estudios superiores, hablantes de español de Buenos Aires. Se registran con la técnica de elicitation task ‘entrevista dirigida’. Se registran tres repeticiones de cada oración. Los resultados indican que el tonema es circunflejo en palabras paroxítonas y proparoxítonas. Sin embargo, el tonema es ascendente en palabras oxítonas: un efecto de truncamiento.Final contours in absolute interrogative sentences without expansion are acoustically analyzed. The corpus is integrated by emissions SVO (SN + SV + SPrep). The SN has pitch accents and lexical stresses within paroxytone words (La guitarra ‘the guitar’), proparoxytone words (La cítara ‘the zither’) and oxytone words (El saxofón ‘the saxophone’). The SV is common to all the emissions: se toca ‘is played’. The SPrep has pitch accents and lexical stresses in paroxytone items (con paciencia ‘with patience’), in proparoxytone items (con pánico ‘with panic’) and in oxytone items (con obsesión ‘with obsession’). The corpora are emitted by two female informants without high school studies, they are Buenos Aires Spanish speakers. The recordings are made by means of the elicitation task technique, in three repetitions of each interrogative sentence. The results indicate that the final contour is circumflex in paroxytone and proparoxytone words. However, the final contour in oxytone words is rising: a truncation effect.Se analizan acústicamente los tonemas en oraciones interrogativas absolutas sin expansión. El corpus está integrado por emisiones SVO (SN + SV + SPrep). El SN tiene acentos tonales y acentos léxicos dentro de palabras paroxítonas (La guitarra), proparoxítonas (La cítara) y oxítonas (El saxofón). El SV es común a todas las emisiones: se toca. El SPrep tienen acentos tonales y acentos léxicos en palabras paroxítonas (con paciencia), en palabras proparoxítonas (con pánico) y en palabras oxítonas (con obsesión). Los corpus son emisiones de dos informantes femeninos sin estudios superiores, hablantes de español de Buenos Aires. Se registran con la técnica de elicitation task ‘entrevista dirigida’. Se registran tres repeticiones de cada oración. Los resultados indican que el tonema es circunflejo en palabras paroxítonas y proparoxítonas. Sin embargo, el tonema es ascendente en palabras oxítonas: un efecto de truncamiento
Modelos de entonación analítico y fonético-fonológico aplicados a una base de datos del español de Buenos Aires
En este trabajo evaluamos un modelo analítico-cuantitativo y otro fonéticofonológico de las características entonativas obtenidas para una base de datos de 741 oraciones declarativas de foco amplio para el español de Buenos Aires. La descripción cuantitativa es la resultante de la aplicación del modelo de superposición de contornos de frecuencia fundamental propuesto por Fujisaki (2003) para diversas lenguas. La descripción fonética que utiliza la marcación de índices de juntura y tono ToBI (Beckman y Ayers, 1993) surge de la percepción de los grupos entonativos y de las prominencias y la aplicación de un método de etiquetado manual (Gurlekian y otros, 2001b), denominado ToBI ampliado (ToBIA). Los resultados obtenidos, extienden la validez del modelo analítico para un gran número de oraciones declarativas de foco amplio del español. Asimismo se comprueba la validez del ToBI-A para producir un contorno de entonación comparable con el real a partir de las nuevas etiquetas propuestas. Para este fin, se realiza una prueba perceptual de comparación por pares y se calculan los errores respecto de la curva real que resultan ser del mismo orden para ambos modelos. También se verifica la validez del ToBI-A en las aplicaciones de síntesis de habla y para la definición fonológica de los acentos tonales de variedades no estudiadas del español.We evaluate here the application of two intonational models –quantitative and phonetic- to the analysis of an Argentine Spanish database of 741 broad-focus declarative sentences. The analytic model is the superpositional model proposed by Fujisaki (2003) for several languages. The phonetic model is the result of the application of a labelling method (Gurlekian et al., 2001b) that incorporates psycho-acoustic measurements and a detailed description of the shape of the accent. Parameters generated by this labelling method were used to synthesize the intonational contours, which were then evaluated in a perception test. Results indicate the validity of Fujisaki´s model for describing a large database of Spanish broad-focus declaratives, and, thus, suggest the importance of Fujisaki’s model for speech technology applications. The extended ToBI model (ToBI-A) is validated by the correlation coefficient and RMSE values as well as the results of the perception test. Ten native speakers of the variety under study judged the synthesized sentences as highly natural with only minor differences with the original contour. These results indicate that the ToBI-A (i) is adequate for a linguistically-meaningful description of the intonation of a new variety; (ii) can be adequately used for modelling intonation.En este trabajo evaluamos un modelo analítico-cuantitativo y otro fonéticofonológico de las características entonativas obtenidas para una base de datos de 741 oraciones declarativas de foco amplio para el español de Buenos Aires. La descripción cuantitativa es la resultante de la aplicación del modelo de superposición de contornos de frecuencia fundamental propuesto por Fujisaki (2003) para diversas lenguas. La descripción fonética que utiliza la marcación de índices de juntura y tono ToBI (Beckman y Ayers, 1993) surge de la percepción de los grupos entonativos y de las prominencias y la aplicación de un método de etiquetado manual (Gurlekian y otros, 2001b), denominado ToBI ampliado (ToBIA). Los resultados obtenidos, extienden la validez del modelo analítico para un gran número de oraciones declarativas de foco amplio del español. Asimismo se comprueba la validez del ToBI-A para producir un contorno de entonación comparable con el real a partir de las nuevas etiquetas propuestas. Para este fin, se realiza una prueba perceptual de comparación por pares y se calculan los errores respecto de la curva real que resultan ser del mismo orden para ambos modelos. También se verifica la validez del ToBI-A en las aplicaciones de síntesis de habla y para la definición fonológica de los acentos tonales de variedades no estudiadas del español
Intra- and inter-speaker variability of sibilant fricative /s/ in Argentine Spanish
En este trabajo se propone estudiar y valorizar el poder discriminativo de la fricativa sibilante /s/, de manera de incorporar este conocimiento en futuros sistemas automáticos de reconocimiento de hablantes. Se seleccionó esta fricativa por ser la principal consonante de acuerdo a la frecuencia de aparición en el corpus. Se determinó un ranking de los parámetros acústicos de dicho fonema que mejor discriminan a un hablante, teniendo en cuenta la menor variabilidad intrahablante y la máxima variabilidad inter-hablante. El material de evaluación fue extraído de la base de datos SpeechDat, con muestras de habla de telefonía fija en Español de Argentina. Los parámetros con mejor puntaje fueron: la Intensidad, el tercer formante (F3), el primer formante (F1) y el primer momento espectral o Centro de Gravedad (CG). El poder discriminante de la fricativa sibilante /s/, con respecto al resto de los fonemas, ha quedado corroborado por su importante aporte a la tasa de reconocimiento de hablantes obtenida, siendo el sexto fonema en importancia después de las vocales /e/, /a/, /o/ y /i/, y la nasal /n/. La tasa de igual error, empleando solamente este fonema, resultó un 35% menor que la media del total de los 30 fonemas involucrados.This paper focuses on the analysis of the discriminative power of the sibilant fricative /s/, in order to incorporate this knowledge in future automatic speaker recognition systems. The selected fricative is the most frequent consonant in the
corpus. An acoustical parameter ranking of /s/ was performed based on minor intra-speaker variability and maximun inter-speaker variability. Evaluation is performed on Argentine-Spanish voice samples from the SpeechDat database recorded on a fixed phone environment. The intensity, the third formant (F3), the
first formant (F1) and the first spectral moment or Center of Gravity (CG) were the best ranked parameters. The sibilant fricative /s/, considered in isolation, has a speaker recognition equal error rate (EER) of 35% lower than the average of the
total of 30 phonemes involved, confirming the importance of this phoneme for the discrimination of speakers as the sixth phoneme in importance, preceded by the vowels /e/, /a/, /o/ and /i/, and the nasal /n/
Aplicación de los índices de perturbación integrado y de precisión articulatoria en pacientes con disfonía espasmódica
La disfonía espasmódica es un desorden vocal severo caracterizado por interrupciones involuntarias de la
fonación, denominada también distonía focal laríngea. Este trabajo da a conocer resultados de la aplicación
del índice de perturbación integrado (IPI), y de precisión articulatoria (IPA), en una población de pacientes
de ambos sexos con disfonía espasmódica, y presenta la comparación con un grupo control, sujetos con
diagnóstico otorrinolaringológico de cuerdas vocales móviles, sin daños estructurales en la mucosa glótica,
ni alteraciones neurológicas que afecten la dinámica cordal. El índice de perturbación agrupa a cuatro
parámetros: Jitter, Shimmer, relación Armónico/Ruido y la Amplitud Diferencial del Cepstrum. Los
resultados muestran diferencias significativas entre los grupos de casos y controles femeninos y masculinos
en los parámetros de índice de perturbación integrado y de grado de precisión articulatoria, por lo que ambos
pueden considerarse indicadores apropiados para caracterizar la falta de estabilidad en la función articulatoria
que se produce en las cavidades resonanciales de las pacientes con disfonía espasmódic
Aplicación de los índices de perturbación integrado y de precisión articulatoria en pacientes con disfonía espasmódica
La disfonía espasmódica es un desorden vocal severo caracterizado por interrupciones involuntarias de la
fonación, denominada también distonía focal laríngea. Este trabajo da a conocer resultados de la aplicación
del índice de perturbación integrado (IPI), y de precisión articulatoria (IPA), en una población de pacientes
de ambos sexos con disfonía espasmódica, y presenta la comparación con un grupo control, sujetos con
diagnóstico otorrinolaringológico de cuerdas vocales móviles, sin daños estructurales en la mucosa glótica,
ni alteraciones neurológicas que afecten la dinámica cordal. El índice de perturbación agrupa a cuatro
parámetros: Jitter, Shimmer, relación Armónico/Ruido y la Amplitud Diferencial del Cepstrum. Los
resultados muestran diferencias significativas entre los grupos de casos y controles femeninos y masculinos
en los parámetros de índice de perturbación integrado y de grado de precisión articulatoria, por lo que ambos
pueden considerarse indicadores apropiados para caracterizar la falta de estabilidad en la función articulatoria
que se produce en las cavidades resonanciales de las pacientes con disfonía espasmódica
Análisis comparativo de la entonación en declarativas absolutas sin expansión
El objetivo de esta presentación es el análisis comparativo de la entonación en informantes con y sin estudios superiores. Se analizan acústicamente los tonemas en oraciones declarativas absolutas sin expansión en ocho informantes. Cuatro de ellos sin estudios superiores de acuerdo a las normas propuestas por el proyecto AMPER (Atlas Multimedia del Espacio Románico) y otros cuatro universitarios, todos hablantes de español de Buenos Aires. El corpus AMPER-Argentina está integrado por emisiones SVO (SN + SV + SPrep). El SN y SPrep tiene acentos tonales dentro de palabras paroxítonas, proparoxítonas y oxítonas. El SV es común a todas las emisiones. Las grabaciones se realizan con la técnica de elicitation task "entrevista dirigida". Se registran tres repeticiones de cada oración. Los resultados muestran que es frecuente encontrar dos frases entonativas. En la frase intermedia se produce el acento de frase (H-), en la frase final se produce principalmente el acento de frase y el tono de frontera (L- L). Los acentos tonales se describen con el criterio fonológico de SP-ToBI y luego se expanden con un criterio fonético que incluye duraciones silábicas y niveles de F0 en ERBs. Los acentos nucleares presentan un máximo de F0 en la misma silaba (L+H*) ó en la postónica (L*+H). Con respecto a las variaciones fonéticas, estas reflejan características del contorno de F0 diferenciadas intra e inter hablantes.Facultad de Humanidades y Ciencias de la Educació
Speech Communication
Contains reports on two research projects.National Institutes of Health (Grant 2 ROl1 NS04332)National Institutes of Health (Training Grant 5 T32 NS07040)C.J. LeBel FellowshipsNational Science Foundation (Grant BNS77-26871
Aplicación de los Índices de Perturbación Integrado, de Precisión Articulatoria y de Aprovechamiento de Energía en dos poblaciones: pacientes con Disfonía Espasmódica y grupo control
La disfonía espasmódica es un desorden vocal severo caracterizado por una interrupción involuntaria de la fonación, denominada también distonía focal laríngea. Este trabajo da a conocer resultados de la aplicación del índice de perturbación integrado (IPI), de precisión articulatoria (IPA) y un índice asociado al aprovechamiento de energía (IAE), en una población de pacientes de sexo femenino con disfonía espasmódica y presenta la comparación con un grupo control, sujetos con diagnóstico otorrinolaringológico de cuerdas vocales móviles, sin daños estructurales en la mucosa glótica, ni alteraciones neurológicas que afecten la dinámica cordal. El índice de perturbación agrupa a cuatro parámetros: jitter, shimmer, relación armónico/ruido y la amplitud del cepstrum. Los resultados muestran diferencias significativas entre los grupos de casos y controles femeninos, en los parámetros: índice de perturbación integrado y grado de precisión articulatoria, por lo que ambos pueden considerarse indicadores apropiados para caracterizar la falta de estabilidad en la función articulatoria que se produce en las cavidades resonanciales de las pacientes con disfonía espasmódica. La cuantificación del aprovechamiento de energía refleja valores similares para ambos grupos de estudio