342 research outputs found
Comparing different machine learning approaches for disfluency structure detection in a corpus of university lectures
This paper presents a number of experiments focusing on assessing the performance of different machine learning methods on the identification of disfluencies and their distinct structural regions over speech data. Several machine learning methods have been applied, namely Naive Bayes, Logistic Regression, Classification and Regression Trees (CARTs), J48 and Multilayer Perceptron.
Our experiments show that CARTs outperform the other methods on the identification of the distinct structural disfluent regions. Reported experiments are based on audio segmentation and prosodic features, calculated from a corpus of university lectures in European Portuguese, containing about 32h of speech and about 7.7% of disfluencies. The set of features automatically extracted from the forced alignment corpus proved to be discriminant of the regions contained in the production of a disfluency. This work shows that using fully automatic prosodic features, disfluency structural regions can be reliably identified using CARTs, where the best results achieved correspond to 81.5% precision, 27.6% recall, and 41.2% F-measure. The best results concern the detection of the interregnum, followed by the detection of the interruption point.info:eu-repo/semantics/publishedVersio
Comparing Different Methods for Disfluency Structure Detection
This paper presents a number of experiments focusing on assessing
the performance of different machine learning methods on the identification of disfluencies and their distinct structural regions over speech data. Several machine learning methods have been applied, namely Naive Bayes, Logistic Regression, Classification and Regression Trees (CARTs), J48 and Multilayer Perceptron. Our experiments show that CARTs outperform the other methods on the identification of the distinct structural disfluent regions. Reported experiments are based on audio segmentation and prosodic features, calculated from a corpus of university lectures in European Portuguese, containing about 32h of speech and about 7.7% of disfluencies. The set of features automatically extracted from the forced alignment corpus proved to be discriminant of the regions contained in the production of a disfluency. This work shows that
using fully automatic prosodic features, disfluency structural regions
can be reliably identified using CARTs, where the best results achieved correspond to 81.5% precision, 27.6% recall, and 41.2% F-measure. The best results concern the detection of the interregnum, followed by the detection of the interruption point
Actions in Practice: On details in collections
Several of the contributions to the Lynch et al. Special issue make the claim that conversation- analytic research into epistemics is ‘routinely crafted at the expense of actual, produced and constitutive detail, and what that detail may show us’. Here, we seek to address the inappositeness of this critique by tracing precisely how it is that recognizable actions emerge from distinct practices of interaction. We begin by reviewing some of the foundational tenets of conversation-analytic theory and method – including the relationship between position and composition, and the making of collections – as these appear to be primary sources of confusion for many of the contributors to the Lynch et al. Special Issue. We then target some of the specific arguments presented in the Special Issue, including the alleged ‘over-hearer’s’ writing of metrics, the provision of so- called ‘alternative’ analyses and the supposed ‘crafting’ of generalizations in epistemics research. In addition, in light of Lynch’s more general assertion that conversation analysis (CA) has recently been experiencing a ‘rapprochement’ with what he disparagingly refers to as the ‘juggernaut’ of linguistics, we discuss the specific expertise that linguists have to offer in analyzing particular sorts of interactional detail. The article as a whole thus illustrates that, rather than being produced ‘at the expense of actual, produced and constitutive detail’, conversation-analytic findings – including its work in epistemics – are unambiguously anchored in such detail. We conclude by offering our comments as to the link between CA and linguistics more generally, arguing that this relationship has long proven to be – and indeed continues to be – a mutually beneficial one
Second language micro-development of an English learner of Chinese :a sociocultural case study
PhD ThesisCompared to many well-researched European languages, the research on the teaching and
learning of Chinese as a second/foreign language is far from adequate. The existing literature
has focused intensively on the acquisition of the linguistic properties of Chinese, while fewer
studies have focused on interactions in L2 Chinese classrooms. This sociocultural case study
seeks to address this gap by examining the dynamic interaction between one English learner
of L2 Chinese and the teachers in a UK university. More specifically, this study provides
insights into how mediation is carried out in this particular context.
Drawing on sociocultural theory (Vygotsky, 1978), and the construct of affordance in the
ecological view of language teaching and learning (van Lier, 2000), this study examines 24
hours of classroom interaction recorded over two months in an L2 Chinese classroom in a UK
university. A qualitative single case study design is chosen to uncover one particular learner’s
language learning process in depth. Employing the microdiscourse analysis approach (van
Compernolle, 2013, 2015), by focusing on the mediation sequences in interaction, the videoand audio-recordings of classroom interactional data are scrutinised.
The findings suggest that in this classroom, mediation is processed by the language teachers
and learners through the contingent use of a variety of linguistic, interactional and semiotic
resources. These resources are interconnected and function in interactional practices such as
scaffolding and co-regulation, create an affordance-rich interactional context in different
teaching and learning activities. The findings also reveal that through the appropriation of
mediational assistance, the learner demonstrates an emergent L2 linguistic development and
L2 interactional competence. Based on the research findings, this study makes suggestions
concerning the teaching of L2 Mandarin Chinese and the training of L2 Chinese teachers. In
particular, for future research, the study recommends a shift of attention from the teaching of
specific linguistic components of the L2, to the pivotal role of mediation and its dynamics in
the language classroom. The findings of this study contribute to the existing literature of L2
classroom interaction and the interactional organism and mediational mechanism of the L2
Mandarin Chinese classroom, broaden the empirical database of L2 teaching and learning
Entrainment in European Portuguese
A presente tese centra-se na análise da adaptação entre falantes em diálogos espontâneos
em Português Europeu (PE). Esta adaptação, também designada por acomodação, sintonia
ou mesmo sincronismo (do inglês entrainment), tem sido descrita como a capacidade de os
seres humanos se ajustarem, tanto a nível comportamental como discursivo, ao seu interlocutor
(Brennan and Clark, 1996; Beˇnuš, 2014a). Esta estratégia tem sido estudada sob diversas
perspetivas, quer para compreender quais os mecanismos linguísticos, psicológicos e sociais
(Levitan et al., 2012; Beˇnuš, 2014a) que a motivam, quer para replicar este comportamento,
tipicamente humano, em sistemas de diálogo automáticos (Levitan, 2014; Hoegen et al., 2019).
Estudos recentes sobre adaptação entre falantes em diferentes situações comunicativas têm
mostrado a importância desta estratégia na resolução de tarefas específicas (e.g., diálogos em
formato map-task, jogos colaborativos) e em sessões de terapia (e.g., terapia conjugal; sessões
de aconselhamento sobre droga e linhas SOS anti-suicídio).
Nesta tese, as semelhanças acústico-prosódicas entre falantes são analisadas ao nível do
diálogo (adaptação global) e em tomadas de palavra intercaladas (adaptação local), tendo em
conta variáveis sociais, como o papel desempenhado pelo falante no diálogo ou a familiaridade
entre falantes. A nível local, verifica-se também se a adaptação entre pares de enunciados
contíguos produzidos por falantes distintos varia de acordo com os tipos de frase (como, por
exemplo, uma declarativa seguida de uma interrogativa ou quando ambas são declarativas ou
interrogativas), bem como com a presença no início do segundo enunciado de estruturas muito
frequentes em fala espontânea, tais como marcadores discursivos (e.g., agora; bem; bom; portanto;
então), disfluências (pausas preenchidas, sobretudo aa e aam); repetições enfáticas (sim,
sim, sim), constituintes afirmativos (sim; exacto; certo) e negativos (não; eu não tenho) e estruturas
ambíguas (palavras que tanto podem ser marcadores discursivos como constituintes afirmativos,
como pronto e ok). Para efetuar esta análise local, foi necessário um estudo mais aprofundado
dos marcadores discursivos nos corpora disponíveis. As marcas de pontuação, que
delimitam constituintes similares a frases (sentence-like units, SUs), as disfluências e até os constituintes
afirmativos já haviam sido estudados em diversos trabalhos em fala espontânea em
PE (Batista, 2011; Batista et al., 2012a; Moniz, 2013; Moniz et al., 2015; Cabarrão, 2013; Cabarrão
et al., 2016). Por outro lado, a literatura sobre marcadores discursivos em dados de fala espontânea
ainda é pouco exaustiva, na medida em que a maioria dos estudos se centram na análise
das funções pragmáticas destas estruturas em textos escritos.
O estudo dos marcadores discursivos visa não só contribuir para uma análise mais completa da adaptação local entre falantes (através dos exemplos destas estruturas em posição
inicial), mas também para a descrição prosódica destas estruturas em fala espontânea em
diferentes corpora, nomeadamente aulas universitárias e diálogos em formato map-task. Considerando
o facto de marcadores e disfluências serem descritos na literatura como estruturas
paralinguísticas que partilham algumas propriedades (Liu et al., 2006; Goldwater et al., 2010),
e ainda o facto de ambos serem considerados na adaptação local, pretendeu-se aferir também
se estas estruturas se distinguem prosodicamente. Como tal, foi realizada uma tarefa de classificação
automática multiclasse para determinar, com base nas propriedades prosódicas das
palavras, quais as que são marcadores discursivos, quais as que são disfluências e quais as que
são SUs.
Os resultados mostram que a seleção de marcadores discursivos depende do corpus e do
falante. No mesmo corpus, existem falantes que tendem a utilizar o mesmo marcador e outros
que variam entre diversas estruturas. Apesar de existir variação por corpus, também se observa
que os marcadores mais frequentes são semelhantes em ambos os corpora. As experiências dentro
do mesmo corpus (in-domain), em que o conjunto de treino e de teste correspondem a dados
selecionados aleatoriamente a partir dos mesmos dados, mostram uma exatidão na classificação
de 87% nas aulas universitárias e de 84%, nos diálogos. As pistas acústico-prosódicas
GeMAPS e, especialmente, as eGeMAPS, parâmetros comummente utilizados em tarefas paralinguísticas,
obtiveram um bom desempenho nos dados. Os resultados sugerem que os marcadores
em posição inicial são geralmente mais fáceis de identificar do que as disfluências.
Para testar a robustez do sistema de classificação entre corpora, realizou-se uma outra experiência
com dados de um corpus para treino e do outro corpus para teste e vice-versa. Tal como
expectável, os valores obtidos nesta tarefa são mais baixos (em cerca de 11% a 12%) do que utilizando
os mesmos dados para treino e teste. Ainda assim, as melhorias obtidas face à base de
comparação em ambos os corpora mostram que esta classificação pode ser utilizada em dados
fora do domínio. De forma a perceber o impacto de cada pista acústico-prosódica na distinção
entre marcadores e disfluências, foi efetuada também uma análise às pistas mais relevantes em
ambos os domínios. As pistas relacionadas com a frequência fundamental (f0), nomeadamente
declives de f0, são as mais relevantes na distinção entre estas estruturas. No geral, apesar da complexidade
desta tarefa, os resultados são muito encorajadores para a classificação automática
multiclasse.
No que diz respeito à análise de adaptação global entre falantes, os resultados evidenciam
adaptação acústico-prosódica, embora expressa em diferentes graus: os falantes não se adaptam
sempre aos mesmos interlocutores e seguindo as mesmas estratégias acústico-prosódicas.
Os resultados mostram que os falantes são mais semelhantes aos seus interlocutores do que ao
seu próprio discurso noutros diálogos (cada falante participa em quatro conversas, duas como
dador e duas como seguidor) na maioria dos parâmetros acústico-prosódicos, nomeadamente
f0, duração e qualidade de voz, sendo a energia o único parâmetro inalterado. Já na comparação
entre pares e não-pares, esta adaptação verifica-se maioritariamente em parâmetros de duração. Este estudo mostra também que os principais parâmetros prosódicos (f0, energia,
duração e qualidade de voz) são monitorizados no processo de adaptação entre falantes, evidenciando
um resultado para o PE que se diferencia dos obtidos para o Inglês e o Mandarim
(Levitan, 2014). Nestas línguas, observa-se adaptação global entre interlocutores principalmente
em pistas de energia, quer na comparação com não-pares, quer com o mesmo falante
noutro diálogo. Quanto ao papel desempenhado, observa-se que cerca de metade dos falantes
é mais consistente no seu discurso enquanto dador, mostrando menos adaptação ao interlocutor,
e a outra metade como seguidor. Tal pode dever-se ao facto de se tratar de um diálogo
colaborativo, em que os falantes trabalham em conjunto para ser bem-sucedidos na tarefa de
chegar ao destino final no mapa. Estes resultados permitem também equacionar o facto de a
adaptação entre falantes estar mais relacionada com o interlocutor, a sua postura e personalidade,
do que com o papel desempenhado no diálogo.
Os resultados obtidos quanto à adaptação local, sem considerar os tipos de frases ou estruturas
específicas, revelam que os falantes são mais semelhantes entre enunciados contíguos do
que entre não contíguos nos quatro parâmetros prosódicos: f0, energia, duração e qualidade de
voz. Estes resultados não estão de acordo com uma análise similar para o inglês (Levitan, 2014):
os falantes adaptam-se nos enunciados contíguos nos parâmetros média e máximo de energia e
harmonics-to-noise-ratio (HNR), mas não em pistas de f0. Esses resultados permitem colocar a
hipótese de que pistas como energia podem ser independentes da língua, pelo menos em corpora
semelhantes, mas não os parâmetros de f0. As experiências realizadas até ao momento
mostram assim que o comportamento acústico-prosódico da adaptação local em PE abrange
não só pistas de energia mas todos os outros parâmetros prosódicos.
Considerando a adaptação entre diferentes tipos de SUs, os pares pergunta-resposta são
aqueles com maior semelhança na maioria dos parâmetros analisados, f0, energia, duração e
qualidade de voz, sendo os pares declarativo-interrogativo aqueles nos quais ocorre menos adaptação.
Estes resultados já eram expectáveis, dada a natureza colaborativa do corpus. Quanto
aos subtipos de interrogativas nos pares pergunta-resposta, existem maiores evidências de
adaptação com perguntas Sim-Não e Tags do que com perguntas parciais. Em PE, as perguntas
Sim-Não e Tags compartilham um contorno alto/ascendente por oposição ao contorno
baixo/descendente associado a perguntas parciais e a declarativas neutras. Além disso, as
perguntas Sim-Não não possuem pistas léxico-sintáticas associadas, apenas prosódicas, o que
pode constituir mais uma evidência para a adaptação local encontrada. Importa ainda referir
que os pares pergunta-resposta são a força motriz da natureza dialógica do corpus, constituído
por tarefas muito colaborativas que têm de ser resolvidas em conjunto por dois interlocutores.
Os resultados deste estudo mostram que as estruturas com maior adaptação local são as que
promovem colaboração e reforço positivo, estratégias que contribuem para a fluidez e sucesso
do diálogo. Em linha com o que foi dito para as SUs, há maiores evidências de adaptação local
com constituintes afirmativos no início do segundo enunciado em enunciados contíguos.
Estes resultados evidenciam, uma vez mais, o esforço colaborativo entre os interlocutores para resolver a tarefa. Por outro lado, as pausas preenchidas e os marcadores discursivos são as estruturas
que apresentam menor grau de adaptação. Uma possível explicação é o facto de que,
quando os falantes proferem estas estruturas, estão já a planear o que dizer a seguir.
O trabalho desenvolvido ao longo desta tese visa contribuir para a análise linguística e
automática de tópicos inexplorados na fala espontânea em PE, nomeadamente estratégias de
adaptação acústico-prosódica entre falantes.This thesis focuses on the analysis of entrainment, an adaptation strategy used by speakers
to become more similar to their interlocutors. The main goal of this study is to find acousticprosodic
similarities between speakers, considering social variables and different structural
metadata events - types of sentence-like units in consecutive turns, as declaratives and interrogatives,
and the presence of discourse markers, affirmative and negative cue words, and
disfluencies, namely filled pauses, in the beginning of turns.
To study the use of entrainment with these events, a special analysis of discourse markers
was performed. Sentence-like units and disfluencies had already been studied in EP spontaneous
speech, lacking only discourse markers. Experiments were performed using several
acoustic-prosodic features and machine learning methods to automatically distinguish
between markers, disfluencies and sentence-like units. In-domain and cross-domain experiments
showed that, using exclusively acoustic-prosodic cues, markers can be fairly discriminated
from the other events.
The analysis of global and local entrainment in a corpus of map-task dialogues showed
evidences of similarities between speakers in the main prosodic parameters, pitch, energy, duration,
and voice quality, even though expressed in different degrees: speakers entrain in distinct
features with different interlocutors.
Regarding sentence-like units types, question-answer turns present stronger similarity, and
declarative-interrogative pairs are the ones where less entrainment occurs. In question-answer
pairs, there is stronger evidence of entrainment with Yes/No and Tag questions than with
Wh- questions, which may be related with the fact that these subtypes are coded in distinctive
prosodic ways. For turn-initial structures, entrainment is stronger when the second turn begins
with an affirmative cue word; and scarce with disfluencies and discourse markers. The different
degrees of entrainment may be related with the informative nature of these structures: in
this data, entrainment is stronger with feedback structures
A Sound Approach to Language Matters: In Honor of Ocke-Schwen Bohn
The contributions in this Festschrift were written by Ocke’s current and former PhD-students, colleagues and research collaborators. The Festschrift is divided into six sections, moving from the smallest building blocks of language, through gradually expanding objects of linguistic inquiry to the highest levels of description - all of which have formed a part of Ocke’s career, in connection with his teaching and/or his academic productions: “Segments”, “Perception of Accent”, “Between Sounds and Graphemes”, “Prosody”, “Morphology and Syntax” and “Second Language Acquisition”. Each one of these illustrates a sound approach to language matters
Variation, norms and prescribed standard in the Mandarin Chinese spoken in Singapore
Relatório de estágio do mestrado em Economia, apresentado à Faculdade de Economia da Universidade de Coimbra, sob a orientação de Carlos Carreira e Edgar Silva.No decorrer do estágio curricular, verificou-se o incremento do número de processos de insolvência de empresas-clientes da My Business, a entidade de acolhimento do presente estágio curricular. A recessão económica de 2008-2012 teve um grande impacto na economia portuguesa, refletindo-se na dinâmica das empresas, onde se observam variações significativas das taxas de entrada e saída de empresas e de criação e destruição de emprego nos diversos sectores. Este trabalho tem um duplo objetivo: primeiro, apresentar e enquadrar sectorialmente e regionalmente a entidade de acolhimento; segundo, analisar os efeitos da crise económica na dinâmica da indústria transformadora portuguesa. Na sua concretização adotou-se uma abordagem não experimental, delineando uma via descritiva e exploratória. Entre 2008 e 2012, observou-se um aumento substancial na destruição de emprego relativamente ao período de pré-crise e um pico na taxa de saída de empresas do mercado em 2011, coincidindo com a aplicação do Memorando de Entendimento. A saída de empresas parece ser influenciada negativamente por variáveis como o nível de produtividade e a dimensão da empresa. A entrada de empresas não apresenta qualquer impacto estatisticamente significativo na taxa de risco de saída das empresas. Durante o período de crise, as restrições financeiras das empresas são preponderantes sobre a produtividade no risco de saída
- …