16 research outputs found

    Global analysis of entrainment in dialogues

    Get PDF
    This paper performs a global analysis of entrainment between dyads in map-task dialogues in European Portuguese (EP), including 48 dialogues, between 24 speakers. Our main goals focus on the acoustic-prosodic similarities between speakers, namely if there are global entrainment cues displayed in the dialogues, if there are degrees of entrainment manifested in distinct sets of features shared amongst the speakers, if entrainment depends on the role of the speaker as either giver or follower, and also if speakers tend to entrain more with specific pairs regardless of the role. Results show global entrainment in almost all the dyads, but the degrees of entrainment (stronger within the same gender), and the role effects tend to be less striking than the interlocutors’ effect. Globally, speakers tend to be more similar to their own speech in other dialogues than to their partners. However, speakers are also more similar to their interlocutors than to speakers with whom they never spoke.info:eu-repo/semantics/publishedVersio

    Adaptação acústico-prosódica entre falantes

    Get PDF
    This paper presents a global analysis of entrainment in map-task dialogues in European Portuguese, including 48 dialogues, between 24 speakers. Our main goal is to analyze the acoustic-prosodic similarities between speaker pairs, namely if there are global entrainment cues displayed in the dialogues, if entrainment is manifested in distinct sets of features shared amongst the speakers, if entrainment depends on the gender and role of the speaker (giver or follower), and if speakers tend to entrain more with specific interlocutors regardless of the role. Results show that globally speakers tend to be more similar to their partners than to their own speech in the majority of the analyzed features, a strong evidence for entrainment. Moreover, almost all the pairs of speakers display cues of global entrainment, even though in different degrees (speakers entrain but in distinct features). Additionally, the role and gender effects tend to be less striking than the specific interlocutor effect. Our results support the fact that all prosodic parameters are monitored by the speakers in our corpus, contrarily to studies for other languages, which indicate that the main cues are energy related.info:eu-repo/semantics/publishedVersio

    Cross-domain analysis of discourse markers in European Portuguese

    Get PDF
    This paper presents an analysis of discourse markers in two spontaneous speech corpora for European Portuguese - university lectures and map-task dialogues - and also in a collection of tweets, aiming at contributing to their categorization, scarcely existent for European Portuguese. Our results show that the selection of discourse markers is domain and speaker dependent. We also found that the most frequent discourse markers are similar in all three corpora, despite tweets containing discourse markers not found in the other two corpora. In this multidisciplinary study, comprising both a linguistic perspective and a computational approach, discourse markers are also automatically discriminated from other structural metadata events, namely sentence-like units and disfluencies. Our results show that discourse markers and disfluencies tend to co-occur in the dialogue corpus, but have a complementary distribution in the university lectures. We used three acoustic-prosodic feature sets and machine learning to automatically distinguish between discourse markers, disfluencies and sentence-like units. Our in-domain experiments achieved an accuracy of about 87% in university lectures and 84% in dialogues, in line with our previous results. The eGeMAPS features, commonly used for other paralinguistic tasks, achieved a considerable performance on our data, especially considering the small size of the feature set. Our results suggest that turn-initial discourse markers are usually easier to classify than disfluencies, a result also previously reported in the literature. We conducted a cross-domain evaluation in order to evaluate the robustness of the models across domains. The results achieved are about 11%-12% lower, but we conclude that data from one domain can still be used to classify the same events in the other. Overall, despite the complexity of this task, these are very encouraging state-of-the-art results. Ultimately, using exclusively acoustic-prosodic cues, discourse markers can be fairly discriminated from disfluencies and SUs. In order to better understand the contribution of each feature, we have also reported the impact of the features in both the dialogues and the university lectures. Pitch features are the most relevant ones for the distinction between discourse markers and disfluencies, namely pitch slopes. These features are in line with the wide pitch range of discourse markers, in a continuum from a very compressed pitch range to a very wide one, expressed by total deaccented material or H+L* L* contours, with upstep H tones

    Adaptação acústico-prosódica local em Português Europeu

    Get PDF
    This paper presents an acoustic-prosodic analysis of entrainment in map-task dialogues in European Portuguese. Our main goal is to analyze how turn-by-turn entrainment varies with distinct structural metadata events: types of sentence-like units (SUs) in consecutive turns (e.g. interrogatives followed by declaratives, or both declaratives), and with the presence of discourse markers, affirmative cue words, and disfluencies in the beginning of turns. Results show that entrainment at turn-exchanges occurs in terms of pitch, energy, duration, and voice quality. Considering SUs types, question-answer pairs are the ones with stronger similarity, as declarative-interrogative turns are the ones where less entrainment occurs. Moreover, in question-answer pairs, Yes/No and Tag questions present stronger evidences of entrainment than Wh- questions. Regarding turn-initial structures, there are evidences of (i) stronger entrainment when the second turn begins with an affirmative cue word, (ii) less strong with ambiguous structures (such as ‘OK’), emphatic affirmative answers, and negative cue words; (iii) and scarce with disfluencies and discourse markers. Different degrees of local entrainment may be related to the informative structure of distinct structural metadata events.info:eu-repo/semantics/publishedVersio

    Cross-domain analysis of discourse markers in European Portuguese

    Get PDF
    This paper presents an analysis of discourse markers in two spontaneous speech corpora for European Portuguese - university lectures and map-task dialogues - and also in a collection of tweets, aiming at contributing to their categorization, scarcely existent for European Portuguese. Our results show that the selection of discourse markers is domain and speaker dependent. We also found that the most frequent discourse markers are similar in all three corpora, despite tweets containing discourse markers not found in the other two corpora. In this multidisciplinary study, comprising both a linguistic perspective and a computational approach, discourse markers are also automatically discriminated from other structural metadata events, namely sentence-like units and disfluencies. Our results show that discourse markers and disfluencies tend to co-occur in the dialogue corpus, but have a complementary distribution in the university lectures. We used three acoustic-prosodic feature sets and machine learning to automatically distinguish between discourse markers, disfluencies and sentence-like units. Our in-domain experiments achieved an accuracy of about 87% in university lectures and 84% in dialogues, in line with our previous results. The eGeMAPS features, commonly used for other paralinguistic tasks, achieved a considerable performance on our data, especially considering the small size of the feature set. Our results suggest that turn-initial discourse markers are usually easier to classify than disfluencies, a result also previously reported in the literature. We conducted a cross-domain evaluation in order to evaluate the robustness of the models across domains. The results achieved are about 11%-12% lower, but we conclude that data from one domain can still be used to classify the same events in the other. Overall, despite the complexity of this task, these are very encouraging state-of-the-art results. Ultimately, using exclusively acoustic-prosodic cues, discourse markers can be fairly discriminated from disfluencies and SUs. In order to better understand the contribution of each feature, we have also reported the impact of the features in both the dialogues and the university lectures. Pitch features are the most relevant ones for the distinction between discourse markers and disfluencies, namely pitch slopes. These features are in line with the wide pitch range of discourse markers, in a continuum from a very compressed pitch range to a very wide one, expressed by total deaccented material or H+L* L* contours, with upstep H tones.info:eu-repo/semantics/publishedVersio

    Section-by-section analysis of linguistic fluency in learner language

    Get PDF
    In this corpus-based study we explore three measurements of L2 fluency – articulation rate, filler particles, and pauses –, both within and between two registers of spontaneous dialogues spoken by Polish learners of German. The measurements are assessed both in toto (as calculated over the whole dialogue) and in parte (as calculated for specific sections). The sections are identified on a quantitative tier that divides the dialogue into four parts, and qualitatively on two linguistically-informed tiers, comprising sections based on dialogue move and task. We challenge the assessment of fluency as an average measurement over the entire dialogue, showing that a sectionwise analysis offers a better understanding of similarities and differences both within and between the two registers.Peer Reviewe

    Classificação prosódica de marcadores discursivos

    Get PDF
    This work describes the discourse markers present in two corpora for European Portuguese, in different domains (university lectures and map-task dialogues). In this study, we also perform a multiclass automatic classification task based on prosodic features to verify in both corpora which words are discourse markers, which are disfluencies, and which are sentence like-units (SUs). Results show that the selection of discourse markers varies across domain and between speakers. As for the classification task, results show that the discourse markers are better classified in the lectures corpus (87%) than in the dialogue corpus (84%). However, cross-domain experiments evidenced that data trained with the dialogue corpus predicts better the events in the lecture corpus, since this domain displays more speakers and therefore complex patterns. In both corpora, markers are more easily classified as SUs than as disfluencies.info:eu-repo/semantics/publishedVersio

    Prosódia, variação e processamento automático

    Get PDF
    Neste capítulo apresentamos um olhar panorâmico sobre a variação prosódica e sobre a sua interface com a área do processamento automático de fala. Tendo por base essencialmente a investigação que tem sido desenvolvida no português europeu sobre corpora de fala espontânea e preparada, em contextos de exposição e de interação, nomeadamente na variedade padrão falada em Lisboa, analisamos a variação da entoação em contextos declarativos e interrogativos, e abordamos as funções pragmáticodiscursivas que podem associar-se também a outros parâmetros prosódicos. Partindo de estudos comparativos inter-estilos (com maior/menor grau de espontaneidade e de planeamento, e natureza mais interativa/expositiva) e inter-falantes (espaço geográfico, género, grupo etário/estatuto), destacamos o papel da variação estilística e sociolinguística da prosódia no português europeu. Mostramos também o papel da variação no processamento automático de proeminência prosódica, pontuação, disfluências e emoções.info:eu-repo/semantics/publishedVersio

    Perception in L2 in a Classroom Environment with L2 Portuguese Chinese Students

    Get PDF
    The purpose of this study is to contribute to the knowledge on the impact of common European Portuguese (EP) phonetic-phonological processes in second language (L2) learners. It is well established that L2 listening is a complex process, and that the most common difficulties among L2 learners are related to speech segmentation and word recognition. Due to the occurrence of connected speech processes, sounds are altered and the word boundaries can be hard to determine. Vowel reduction within and across word boundaries is usually described as a very frequent process in EP. The reduction of vowels is even more evident in spontaneous speech, e.g. the word 'telefone' (jtifi'foni] in the citation form, 'telephone') can be produced as [t'fon]. The interplay between these processes can be particularly impactful for L2 learners, in word recognition. Furthermore, this correlation is scarcely studied in a classroom setting. The present study explores the impact of vowel reduction and connected speech processes in word recognition tasks from isolated words to continuous speech. Furthermore, it aims to understand the main difficulties that L2 learners, at the intermediate levei B 1, experience dealing with these phenomena. Lastly, it will contribute to understand not only the acquisition of vowel reduction and connected speech processes but also whether L2 learners could cope with them. Therefore, it was designed a set of perception experiments involving these phenomena in increasing degrees of difficulty: single word identification without (i) and with vowel reduction (ii); word identification with simple (iii) and complex connected speech processes (iv). The experiments were conducted in an ecological setting of an intensive Portuguese course, of the intermediate levei B 1, at the University of Lisbon. A contrai group of EP native speakers also performed the experiments. The overall scores revealed a decreasing tendency: (i) 94%; (ii) 65%; (iii) 31 %; (iv) 16%. The results reveal that word recognition is compromised due to the connected speech processes. Vowel reduction and the consequent deletion of segments also affects the recognition of isolated spoken words even in read speech. The didactic outcomes of the experiments are relevant to contribute to the design of a proposal of a set of listening exercises focused on the practice of these phonetic-phonological phenomena. The sequence is based on the use of Computer-Assisted Language Learning (CALL) technology, and includes two games and a set of perception exercises in which songs are also used as input.Este estudo tem como objetivo contribuir para o conhecimento do impacto dos processos fonético-fonológicos do Português Europeu (PE), em aprendentes de PE Língua Segunda (L2). Pela nossa experiência como falantes nativos, sabemos que ouvir na própria língua nativa (LI) é um processo natural e intuitivo, ainda que complexo. No entanto, talvez por experiência própria também se saiba que, quando se aprende uma língua estrangeira, um dos maiores desafios está relacionado com a compreensão oral. Os mecanismos auditivos que intervêm na compreensão oral da língua nativa são os mesmos que intervêm na compreensão oral da L2. Ouvir e compreender uma língua estrangeira é um processo muito complexo. Quando ouvimos, é necessário segmentar o discurso, e reconhecer as palavras no contínuo sonoro. No entanto, devido à ocorrência de processos fonéticos, próprios do discurso oral, os sons são alterados e coarticulados. Ao processar a L 1, os falantes nativos não têm quaisquer dificuldades. Pelo contrário, os aprendentes L2 podem ter várias dificuldades no que diz respeito ao reconhecimento de palavras no contínuo sonoro. Dada a ocorrência dos vários fenómenos de coarticulação, as fronteiras de palavra deixam de ser percetíveis e evidentes. Em PE, a redução vocálica está bem descrita na literatura, e é referida como um processo muito produtivo. Uma das suas características é promover a redução e o apagamento de vogais átonas. Como resultado, há uma frequente ocorrência de sequências fonéticas de consoantes nas produções orais. Interessa também salientar que a redução vocálica não só ocorre em fala espontânea como também é frequente em fala semi-espontânea e não espontânea. O PE também é rico em processos de coarticulação, e muitos deles estão em direta relação com a redução e o apagamento das vogais átonas. Os processos de discurso oral contínuo muito bem estudados e descritos. Entre os processos de coarticulação estão os encontros vocálicos, os fenómenos de sândi, a assimilação do vozeamento e a inserção da iode Li]. Estes processos causam diversas alterações nos sons das palavras, sobretudo nos que estão presentes nas fronteiras de palavra. Além disso, promovem ainda a realização e a inserção de outros sons, que não têm uma representação gráfica. Outros são responsáveis pela restruturação da estrutura silábica, causando a articulação entre os sons das palavras vizinhas. Do que é conhecido da literatura, a interação entre a redução vocálica e os fenómenos de sândi externo, coarticulação, assimilação, etc. , e o seu impacto na compreensão oral de aprendentes L2 ainda não está estudada. Além disso, ainda não existem estudos realizados em contexto ecológico de sala de aula, que se debrucem sobre esta correlação. Pelo que se sabe, também, o ensino destes processos fonético-fonológicos não é amplamente explorado nos diversos referênciais e programas de ensino de PLE. Como tal, existe a necessidade de consciencializar os alunos para a ocorrência destes processos na oralidade, e de como têm impacto na sua compreensão oral. Isso terá também uma relação direta com a aprendizagem e o desenvolvimento da proficiência dos estudantes. Portanto, o presente estudo tem como objetivo explorar o impacto da ocorrência de processos fonético-fonológicos, tais como a redução vocálica e os processos da oralidade, em tarefas de reconhecimento e identificação de palavra. Estas tarefas foram realizadas quer em contextos de palavra isolada quer em contextos de discurso oral contínuo. Além disso, este estudo procura entender, e descrever, as maiores dificuldades dos aprendentes L2, no nível intermédio B 1, face à presença destes processos fonéticos na oralidade. Finalmente, este estudo será não só um contributo para um melhor conhecimento do processo de aquisição da redução vocálica e dos fenómenos de coarticulção, mas também para entender em que momento do processo de aprendizagem os estudantes precisam de treinar estas estruturas. Portanto, foi criada uma sequência de testes percetivos que incluíram a ocorrência destes fenómenos em diferentes níveis de complexidade: tarefas de reconhecimento de palavra isolada sem (i) e com a produção de redução vocálica (ii); tarefas de reconhecimento de palavra com ocorrência dos processos de discurso oral em contextos simples (iii) e complexos (iv). Os testes de perceção foram aplicados em contexto ecológico de sala de aula de um curso intensivo anual de Português Para Estrangeiros (PLE), do nível intermédio (Bl ), na Universidade de Lisboa. Todos os participantes eram falantes nativos do Chinês Mandarim. Os testes também foram aplicados a um grupo de controlo, composto por falantes nativos do PE. Nos resultados obtidos houve, em geral, uma tendência de decréscimo das percentagens para as respostas corretas conforme o aumento da complexidade das estruturas linguísticas: (i) 94%; (ii) 65%; (iii) 31 %; (iv) 16%. Estes resultados indicam que a ocorrência dos fenómenos do discurso oral comprometeram a tarefa de reconhecimento de palavra, nos diversos contextos. No entanto, este impacto foi bastante evidente nos contextos que testaram fala (serni-) espontânea. Além disso, a redução vocálica, e o consequente apagamento de vogais átonas, afetou ainda o reconhecimento de palavras isoladas. Para complementar estes resultados, foi também realizada a análise das transcrições ortográficas dos alunos que permitiu a descrição dos erros ortográficos mais frequentes. Por outro lado, contribuíram também para entender a interação entre a oralidade e a escrita na sua aprendizagem do PEcomo L2. As transcrições revelaram também que a presença da redução vocálica aumentou a produção de grupos consonânticos fonéticos, algo que se tornou evidente pelo facto de, frequentemente, apenas partes das palavras-alvo (ou apenas consoantes) terem sido transcritas. É importante também salientar que, aquando da realização das tarefas de identificação de palavras em contexto de fala (serni-) espontânea (com a presença de fenómenos de coarticulação), vários alunos transcreveram sequências de palavras articuladas, incluindo os sons articulados e alterados por processos de assimilação, por exemplo. Do ponto de vista didático, os resultados obtidos foram relevantes para a construção de uma proposta de uma sequência didática com exercícios para a prática e para o treino da componente auditiva. Esta proposta de exercícios tem um especial ênfase no ensino dos processos fonéticofonológicos do PE. Esta sequência é baseada na tecnologia existente para a Aprendizagem de Línguas Assistida por Computador (ALAC). Portanto, foram desenhados dois jogos, uma versão do clássico 'Jogo da Forca' e o jogo das 'Palavras Bomba-Relógio'. Finalmente, a sequência também inclui uma série de exercícios de perceção oral, intitulada 'À Procura dos Limites' no qual se pretende praticar o reconhecimento das fronteiras das palavra em diferentes contextos de coarticulação. Além disso, a série inclui uma secção de exercícios lúdica, nos quais são utilizadas músicas portuguesas como input auditivo
    corecore