Perception des hésitations : liens entre accord inter-annotateurs et contextes prosodiques

Abstract

Les allongements et pauses pleines représentent 1.9 à 7.6 % du flux verbal et sont reconnus comme des caractéristiques inhérentes des productions discursives (Eklund, 2010 ; Foxtree, 1995). En production, ils reflètent divers processus discursifs et cognitifs tels que la planification, la recherche de mots ou la mise en saillance d’une nouvelles entité (Arnold, 2010 ; Bortfeld et al., 2001 ; Fraundorf & Watson, 2008 ; Schmitter-Edgecombe, Vesneski, & Jones, 2000). Ces marqueurs peuvent présenter des distributions et patrons de cooccurrences réguliers : les pauses pleines et allongements sont préférentiellement suivis par des pauses silencieuses (Goldman et al, 2001 ; Moniz et al. 2008). Selon ces auteurs, les allongements seraient causés par un retardement de la production discursive. En perception, les marqueurs occasionnent par ailleurs des attentes et interprétations chez les interlocuteurs – e.g. l’anticipation d’un nouvel élément discursif (Barr, 2010 ; Brennan et Williams, 1995 ; Cole et al., 2005). De fait, les interlocuteurs jugent plus disfluents les segments de parole contenant des hésitations sans pause silencieuse subséquente (Moniz et al., 2009). Toutefois, à notre connaissance, peu d’études ont examiné si la perception même des hésitations est univoque et si celle-ci est influencée par la présence d’hésitations environnantes. L’expérience perceptive d’annotation proposée tente de répondre à ces questions. Six enregistrements de LOCAS-F (Louvain Corpus of Annotated Speech – French, Degand, Martin & Simon, 2014) et du corpus de thèse de Rousier-Vercruyssen (projet FNS n°140269, Fossard et al., en prep.) d’une durée totale de 12 minutes (3266 syll.) ont été annotés sous Praat (Boersma & Weenink 2009) par trois linguistes francophones. Quatre catégories sont à l’étude : syllabe non-disfluente, syllabe porteuse d’un allongement dit d’hésitation, syllabe représentant une pause pleine (schwa post-tonique, euh isolé, mais également hum et mh), ainsi que le reparandum de quatre autres marques de (dis)fluences (répétitions, amorces, auto-corrections, insertions). Les résultats indiquent un fort taux d’accord inter-annotateurs (Kappa Fleiss = 0.71, p syllabes non disfluentes (κ =0.75) > allongements d’hésitation (κ =0.63) > reparandum des autres marques de (dis)fluences (κ =0.43). Références Arnold, J. E. (2010). How speakers refer: the role of accessibility. Language and linguistics Compass, 4, 187-203. Barr, D. J. (2010). The role of fillers in listeners attributions for speaker disfluency. Language and cognitive processes, 25 (4), 441-455. Boersma, P., & Weenink, D. (2009). Praat: doing phonetics by computer (version 5.1.05) [computer program]. Bortfeld, H., Leon, S. D., Bloom, J. E., Schober, M. F., & Brennan, S. E. (2001). Disfluency rates in conversation: Effects of age, relationship, topic, role, and gender. Language and speech, 44 (2), 123-147. Brennan, S. E., & Williams, M. (1995). The feeling of another’s knowing: Prosody and filled pause as cues to listeners about the metacognitive state of speakers. Journal of memory and language, 34, 383-398. Cole, J., Hasegawa-Johnson, M., Shih, C., Kim, H., Lee, E.-K., Lu, H.-Y. Mo, Y. & Yoon, T.-J. (2005). Prosodic parallelism as a cue to repetition disfluency. In Proceedings of Diss05, disfluency in spontaneous speech workshop. Duez, Danielle. 2001a. Acoustic-phonetic characteristics of filled pauses in spontaneous French speech: preliminary results. Proceedings of Workshop Disfluencies (ISCA), 41–44. Edinburg, UK. Eklund, R. & M. Wirén. 2010. Effects of open and directed prompts on filled pauses and utterance production. In: Proceedings of Fonetik 2010, Lund University, 23–28. Fossard, M., Achim, A. M., Rousier-Vercruyssen, L., Gonzalez, S. & Champagne-Lavau, M. (en prep.). Discourse construction through the modulation of referential markers in a collaborative storytelling in sequence task. Fox Tree, J. E. F. (1995). Fox Tree_1995_The effects of False Starts and Repetitions on the Processing of Subsequent Words in Spontaneous Speech.pdf. Fraundorf, S. H. & Watson, D. G. (2008). Dimensions of Variation in Disfluency Production in Discourse. In Proceedings of LONDIAL. Martin, Laurence J., Liesbeth Degand & Anne-Catherine Simon. 2014. Forme et fonction de la périphérie gauche dans un corpus oral multigenres annoté. Corpus(13). 243–265. (5 May, 2015). Moniz, Helena, Ana Isabel Mata, Isabel Trancoso & Céu Viana. 2008. How can you use disfluencies and still sound as a good speaker? INTERSPEECH, 1687. Moniz, Helena, Isabel Trancoso & Ana Isabel Mata. 2009. Classification of disfluent phenomena as fluent communicative devices in specific prosodic contexts. Proceedings of Interspeech 2009, 1719–1722. Brighton, UK. Goldman, J.; Avanzi, M. & Auchlin, A. (2010). Hesitations in read vs. spontaneous French in a multi-genre corpus. In Proceedings of DiSS-LPSS Joint Workshop 2010, 101-102. Schmitter-Edgecombe, M.; Vesneski, M. & Jones, D. (2000). Aging and Word-Finding: A Comparison of Spontaneous and Constrained Naming Tests. Archives of Clinical Neuropsychology, 15, 479-493

    Similar works

    Full text

    thumbnail-image

    Available Versions