822 research outputs found

    Intonation & Prosodic Structure in Beaver (Athabaskan) - Explorations on the language of the Danezaa

    Get PDF
    This dissertation reports on qualitative and quantitative investigations on the intonation and the prosodic structure of Beaver, an endangered Athabaskan language of Northwest Canada. The focus of the study is on the Northern Alberta dialect of Beaver, which has lexical tone and is a high marking Athabaskan language. The theoretical framework of the analysis is the Autosegmental Metrical (AM) theory. Following some background on intonation and prosody as well as the theoretical modelling, we summarize contributions dealing with intonation in languages that share certain features with Beaver, i.e. tone languages, polysynthetic languages and finally the related Athabaskan languages. After a brief introduction to the grammatical structure and the sociolinguistic situation of Northern Alberta Beaver, the database of the present study is introduced. It consists of narratives and task oriented dialogues as well as recordings elicited with stimuli sets. In the domain of intonation and prosody, three topics are investigated in detail. First, domain initial prosodic strengthening is analyzed. We show that a boundary initial position at higher constituents of the prosodic hierarchy has a lengthening effect on VOT of both aspirated and unaspirated plosives, while nasals are shortened in this context. Additionally, effects of morphological category (stem vs. prefix) and intervocalic position � two mechanisms that have been described for other Athabaskan languages � are also attested for Beaver to some degree. Second, the intonational tones that have been found in the corpus are analyzed within the AM theory. In Northern Alberta Beaver, boundary tones and phrase accents make up the intonational inventory. Most notably, an initial phrase accent is used to mark contrast, which is a device that has not been reported for the marking of information structure in other languages. Lastly, the interaction of information structure with pitch range in complex noun phrases is tested in a controlled experiment. Here, we find that pitch range is significantly wider for new information than for given, which is due to a raising of the top line, while the baseline is not affected to the same extend

    Etunimien syntaktiset ja prosodiset muodot monenkeskisessä institutionaalisessa vuorovaikutuksessa

    Get PDF
    This paper examines one aspect of turn-taking organization in institutional interactions: the use of first names and their prosodic marking for next-speaker selection. Institutional interaction is characterized by asymmetrical rights to talk and pre-allocation of action. This involves the restriction of one party to asking questions and the other to responding to them. The analysis focuses on two of these multiparty formal situations: co-present classroom participants and live interactive television broadcast with remote participants. In each context, turn allocation is determined by one party: the teacher or TV host. After asking a question as a sequence-initiating action, the teacher or host designates the next speaker by name. The use of first names is situatedly examined in terms of turn-taking organization and prosodic characteristics. The study examines how the prosodic marking is context-sensitive: do the participants have visual access to each other’s actions and how is a name used to attract attention? This paper analyses the formation and maintaining of a mutual orientation towards a single conversational action: selecting and giving the floor to a co-participant of the conversation in an institutional framework. These detailed descriptions of the sequential order are based on ethnomethodologically-informed conversation analysis. The objective is to compare four “single cases”, preserving the specificities and “whatness” of each excerpt.Peer reviewe

    INTONATION IN CONTACT: PROSODIC TRANSFER AND INNOVATION AMONG YAMI-MANDARIN BILINGUALS

    Get PDF
    Yami, an Austronesian language spoken on Orchid Island, Taiwan (less than 1,500 fluent speakers), is currently facing endangerment due to heavy contact with Mandarin. This dissertation investigated whether there is contact-induced prosodic variation in Yami-Mandarin bilingual speech, while also describing and documenting the evolution of Yami intonation. I advanced the description of key aspects of Yami intonation, which allowed the examination of Yami-Mandarin bilingual intonation patterns. This permitted identification of potential Mandarin influence in Yami and vice versa. Five sentence types (statement, neutral question, confirmation-seeking question, default statement question (SQ1), and statement question conveying lighter incredulity (SQ2)) were elicited using a new paradigm – the Interactive Card Game. Three acoustic parameters were considered: final boundary tone, F0 slope, and mean pitch height. To gauge the impact of language background, 44 participants were divided into Yami-monolingual, Yami-dominant bilingual, balanced bilingual, Mandarin-dominant bilingual, and Mandarin-monolingual groups. Older fluent Yami speakers distinguished falling statements and neutral questions from rising confirmation-seeking questions and SQ1s, but had no authentic SQ2. Bilinguals, however, transferred this Mandarin question type (SQ2) into Yami. This was then intertwined with Yami intonation to form a hybrid pattern. For Mandarin production, ethnically Yami, linguistically Mandarin-monolinguals patterned exactly with mainland Mandarin speakers by making a three-way distinction among falling, level, and rising intonation patterns. Bilinguals only showed a two-way distinction merging SQ1 and SQ2 into a single SQ category (a Yami substrate effect), which was then realized with a Mandarin-SQ2-like level contour to form another hybrid pattern. The current linguistic ecological context plays a crucial role in determining the evolution of bilingual intonation. Specifically, considering the imbalanced power relationships between the groups and the socioeconomic pressures on Yami speakers, the two innovative hybrid patterns suggest an in-progress asymmetrical convergence of the intonation systems. This research expands the body of work on contact-induced prosodic change underscoring that higher-level prosody is permeable under contact. It also adds to studies on Austronesian/indigenous language intonation features. The broader impacts extend to heritage language education as the study has the potential to help Yami teachers develop new strategies in teaching language prosody

    A Prosodic Turkish text-to-speech synthesizer

    Get PDF
    Naturalness in Text-to-Speech systems is very important in achieving high quality waveform. The naturalness of the waveform is highly correlated with phonetic coverage and prosodic features such as, duration and F0 contour. Duration determines the timing for the synthesized phoneme, whereas F0 contour determines fundamental frequency component of the waveform. This thesis presents the development of a prosodic Text-to-Speech System for Turkish Language using the Festival Tool [31]. We describe a complete realization of a new male voice, covering allophones of Turkish using duration and F0 parameters. The duration of the allophones and the word stress have been studied extensively. Sentence stress and phrasal stress are also discussed by in less detail. Carrier words are designed approximately for all allophone-allophone combinations. 1680 carrier words are recorded in a sound-proof recording studio. LPC (linear predictive coding) and RES (residual) parameters are computed. The text normalisation module is implemented for abbreviations and numbers. Durations for the allophones are entered. Sentence level and word level F0 generation modules are implemented. By increasing the number of phonemes and giving prosody we obtained a more natural sounding Text-to-Speech System for Turkish Language

    Adult ESL Oral Reading Fluency and Silent Reading Comprehension

    Get PDF
    A descriptive study of second language adults studying ESL at the beginning, intermediate, and advanced levels in a post-secondary academic program revealed that their oral reading fluency had a significant, low-to-moderate correlation with scores on a measure of silent reading comprehension. The correlation was slightly stronger for measures of accuracy than speed, and strongest for miscue ratio. The correlation increased as proficiency level increased. Among different first language groups, the correlation was highest for Hispanic learners, and lowest for Chinese. Furthermore, all fluency measures correlated better with a listening measure than with the silent reading comprehension measure. When a system of using words correct per minute was contrasted with a fluency rubric using descriptive measures of expressive reading, the correlation with silent reading was found to be almost the same, but the system of words correct per minute had higher reliability. A miscue analysis of seven intermediate learners\u27 oral reading indicated that speed does not necessarily increase as silent reading proficiency increases, but accuracy does; Chinese students are a special case who do not fit the profile of the other language groups; and the value of miscue analysis with this population is somewhat limited because of the foreign accent problem. It was also found that the fluency tools mirrored overall progress in proficiency level, and listening comprehension predicted silent reading comprehension better than any fluency measure or combination of measures, with little increase in predictive power by adding fluency measures

    Acoustic correlates of encoded prosody in written conversation

    Get PDF
    This thesis presents an analysis of certain punctuation devices such as parenthesis, italics and emphatic spellings with respect to their acoustic correlates in read speech. The class of punctuation devices under investigation are referred to as prosodic markers. The thesis therefore presents an analysis of features of the spoken language which are represented symbolically in text. Hence it is a characterization of aspects of the spoken language which have been transcribed or symbolized in the written medium and then translated back into a spoken form by a reader. The thesis focuses in particular on the analysis of parenthesis, the examination of encoded prominence and emphasis, and also addresses the use of paralinguistic markers which signal attitude or emotion.In an effort to avoid the use of self constructed or artificial material containing arbitrary symbolic or prosodic encodings, all material used for empirical analysis was taken from examples of electronic written exchanges on the Internet, such as from electronic mail messages and from articles posted on electronic newsgroups and news bulletins. This medium of language, which is referred to here as written conversation, provides a rich source of material containing encoded prosodic markers. These occur in the form of 'smiley faces' expressing attitudes or feelings, words highlighted by a number of means such as capitalization, italics, underscore characters, or asterisks, and in the form of dashes or parentheses, which provide suggestions on how the information in a text or sentence may be structured with regard to its informational content.Chapter 2 investigates in detail the genre of written conversation with respect to its place in an emerging continuum between written and spoken language, concentrating on transcriptional devices and their function as indicators of prosody. The implications these symbolic representations bear on the task of reading, by humans as well as machines, are then examined.Chapters 3 and 4 turn to the acoustic analysis of parentheticals and emphasis markers respectively. The experimental work in this thesis is based on readings of a corpus of selected materials from written conversation with the acoustic analysis concentrating on the differences between readings of texts with prosodic markers and readings of the same texts from which prosodic markers have been removed. Finally, the effect of prosodic markers is tested in perception experiments involving both human and resynthesized utterances

    Automatic prosodic analysis for computer aided pronunciation teaching

    Get PDF
    Correct pronunciation of spoken language requires the appropriate modulation of acoustic characteristics of speech to convey linguistic information at a suprasegmental level. Such prosodic modulation is a key aspect of spoken language and is an important component of foreign language learning, for purposes of both comprehension and intelligibility. Computer aided pronunciation teaching involves automatic analysis of the speech of a non-native talker in order to provide a diagnosis of the learner's performance in comparison with the speech of a native talker. This thesis describes research undertaken to automatically analyse the prosodic aspects of speech for computer aided pronunciation teaching. It is necessary to describe the suprasegmental composition of a learner's speech in order to characterise significant deviations from a native-like prosody, and to offer some kind of corrective diagnosis. Phonological theories of prosody aim to describe the suprasegmental composition of speech..

    Towards a clinical assessment of acquired speech dyspraxia.

    Get PDF
    No standardised assessment exists for the recognition and quantification of acquired speech dyspraxia (also called apraxia of speech, AS). This thesis aims to work towards development of such an assessment based on perceptual features. Review of previous features claimed to characterise AS and differentiate it from other acquired pronunciation problems (dysarthrias; phonemic paraphasia - PP) has proved negative. Reasons for this have been explored. A reconceptualisation of AS is attempted based on physical studies of AS, PP and the dysarthrias; their position and relationship within coalitional models of speech production; by comparison with normal action control and other dyspraxias. Contrary to the view of many it is concluded that AS and PP are dyspraxias (albeit different types). However, due to the interactive nature of speech-language production and behaviour of the vocal tract as a functional whole AS is unlikely to be distinguishable in an absolute fashion based on single speech characteristics. Rather it is predicted that pronunciation disordered groups will differ relatively on total error profiles and susceptibility to associated effects (variability; propositionality; struggle; length-complexity; latency-utterance times). Using a prototype battery and refined error transcription and analysis procedures a series of studies test predictions on three groups: spastic dysarthrics (n = 6) AS and PP without (n = 12) and with (n = 12) dysphasia. The main conclusions do not support the error profile hypotheses in any straightforward manner. Length-complexity effects and latency-utterance times fail to consistently separate groups. Variability, propositionality and struggle proved the most reliable indicators. Error profiles remain the closest indicators of speakers' intelligibility and therapeutic goals. The thesis argues for a single case approach to differential diagnosis and alternative statistical analyses to capture individual and group differences. Suggestions for changes to the prototype clinical battery and data management to effect optimal speaker differentiation conclude the work

    Aspects of prosody in English and Swahili

    Get PDF

    The timing of tone group constituents in the advanced Polish learner's English pronunciation

    Get PDF
    Niniejsza praca poświęcona jest analizie relacji czasowych pomiędzy elementami składowymi frazy intonacyjnej w wymowie angielskiej zaawansowanego ucznia polskiego. Celem pracy jest wykazanie i opisanie różnic w tym zakresie między polskim uczniem a rodzimym użytkownikiem języka angielskiego oraz ich interpretacja w kontekście glottodydaktycznym. W części teoretycznej omówiono historię i stan badań nad prozodią języka mówionego oraz metodologię akustycznych badań mowy. Rozdział pierwszy przedstawia modele struktury prozodycznej wypowiedzi w celu ustalenia jednostek istotnych dla analizy relacji czasowych, czyli tych elementów frazy, które mogą stanowić odrębną domenę procesów wpływających na czas trwania artykulacji. Rozdział ten charakteryzuje również owe procesy, opisując domenę i zasięg ich oddziaływania. Drugi rozdział poświęcony jest pojęciu akcentu, który jest kluczowym zjawiskiem decydującym o ogólnym kształcie prozodycznym wypowiedzi, a więc rytmie, intonacji i tytułowych relacjach czasowych między poszczególnymi elementami. Trzeci rozdział przedstawia historię badań nad rytmem języka od momentu przedstawienia przez Kennetha Lee Pike’a idei podziału języków świata na dwie klasy według ogólnych tendencji rytmicznych mowy, do współczesnych metod określania rytmu w języku na podstawie parametrów, takich jak zróżnicowanie długości samogłosek czy stopień złożoności zbitek spółgłoskowych. W rozdziale trzecim przedstawione są również problemy ucznia polskiego z opanowaniem angielskiej prozodii wynikające z różnic pomiędzy językami. Rozdział czwarty rozpoczyna badawczą część książki. Opisuje empiryczne badanie porównawcze relacji czasowych w tekście czytanym przez polskich słuchaczy pierwszego roku kolegium nauczycielskiego w odniesieniu do analogicznych relacji w mowie czytanej rodzimych użytkowników standardowej angielszczyzny brytyjskiej. Dodatkowo, nagrania słuchaczy kolegium powtórzono po siedmiu miesiącach w celu uzyskania danych na temat kierunku i tempa rozwoju ich wymowy angielskiej w warunkach nauczania obejmującego standardowy akademicki kurs praktycznej fonetyki angielskiej. Poszczególne sekcje przedstawiają oparte na dyskusji z części teoretycznej założenia metodologiczne, hipotezy badawcze, materiał językowy wybrany do analizy, strukturalno-akustyczne kryteria podziału analizowanych fraz intonacyjnych na mniejsze jednostki (stopy, sylaby, segmenty) oraz techniczne procedury badawcze. Piąty rozdział koncentruje się na przedstawieniu wyników odnoszących się do czasu trwania segmentów wokalicznych w wymowie obu grup respondentów. Analizie poddano zarówno bezwzględną długość samogłosek, jak również ich relatywną długość w odniesieniu do kontekstu. Rozdział szósty przedstawia wyniki odnoszące się do wyższych poziomów hierarchii prozodycznej: relacje czasowe pomiędzy sylabami w obrębie stopy, jak również proporcje czasu trwania stóp w różnych pozycjach frazy intonacyjnej. W rozdziale siódmym dokonano podsumowania wyników i przedstawiono propozycje odnośnie do kierunków przyszłych badań i wnioski dydaktyczne mogące poprawić skuteczność przyswajania wymowy angielskiej przez Polaków. Na podstawie przeprowadzonych badań stwierdzono wyraźnie dłuższy czas trwania elementów nieakcentowanych (samogłosek, sylab, wyrazów funkcyjnych, anakruzy) w wymowie Polaków, z wyjątkiem końcowej sylaby frazy intonacyjnej. Istotne różnice wystąpiły zarówno w wartościach absolutnych, jak i w proporcjach czasowych. Nie zaobserwowano natomiast wyraźnych różnic w bezwzględnej długości samogłosek i sylab akcentowanych pomiędzy obiema grupami respondentów, z wyjątkiem sylab akcentowanych na końcu frazy, gdzie są one znacznie dłuższe w wymowie rodowitych Anglików. Większy niż u Polaków kontrast między elementami akcentowanymi a nieakcentowanymi wynika prawdopodobnie z bardziej radykalnej redukcji elementów nieakcentowanych w angielskiej wymowie rodzimej. Relacje czasowe w obrębie stopy oraz w jednostkach wyższych poziomów struktury prozodycznej, mogące wskazywać na tendencje rytmiczne w mowie, również sugerują rozbieżności między grupami respondentów w miejscach, gdzie decydujący wpływ na czas trwania jednostek ma redukcja elementów nieakcentowanych. Istotne różnice znaleziono także w przypadku jednostek leksykalnych, stanowiących stały element często używanych konstrukcji gramatycznych, np. have to czy going to. Zaobserwowano ponadto większą u rodzimych użytkowników języka angielskiego tendencję do wyrównywania czasu trwania stopy rytmicznej obejmującej ciąg sylab nieakcentowanych oraz poprzedzającą je sylabę akcentowaną. Największe rozbieżności dotyczyły czasu trwania anakruzy, która w wymowie respondentów angielskich jest wyraźnie krótsza. W odniesieniu do tendencji rozwojowych polskich uczniów, stwierdzono znaczące zbliżenie się wyników do norm wymowy rodzimej po siedmiu miesiącach od pierwszego badania. Wzrosło ogólne tempo mowy, które jednak nie zawsze szło w parze z uzyskaniem bardziej “angielskich” proporcji czasu trwania składowych elementów wypowiedzi. O około połowę zmniejszyła się różnica między Polakami i Anglikami w bezwzględnych wartościach czasu trwania jednostek nieakcentowanych, choć w niektórych kontekstach (np. w anakruzie) większości uczniów nie udało się uzyskać wyników zbliżonych do wymowy rodzimych użytkowników języka angielskiego. Nie zmieniły się również istotnie wskaźniki określające zróżnicowanie długości samogłosek akcentowanych, co wskazuje na trudność w wykorzystaniu różnic czasowych do kontrastowania samogłosek napiętych i nienapiętych oraz sygnalizowania dźwięczności wygłosu sylaby i granic domen prozodycznych. Wyniki badań oraz jakościowa analiza pojedynczych kontekstów sugerują duży wpływ artykulacji segmentów na relacje czasowe na poziomie frazy i zdania. W związku z tym zalecane jest utrzymanie tradycyjnej kolejności wprowadzanych ćwiczeń fonetycznych, polegającej na treningu wymowy segmentów w stopniowo rozszerzanym kontekście, a następnie koncentracji na kolejnych, wyższych poziomach struktury prozodycznej wypowiedzi. Przedstawione w niniejszej pracy rezultaty badań oraz wykorzystanie zastosowanych w nich metod mogą posłużyć do identyfikacji konkretnych problemów w przyswajaniu obcej wymowy, jak również wprowadzić element obiektywizmu do zazwyczaj impresjonistycznej oceny warstwy prozodycznej wymowy języka obcego
    corecore