285 research outputs found
Contributions of cochlea-scaled entropy and consonant-vowel boundaries to prediction of speech intelligibility in noise
published_or_final_versio
A model of sonority based on pitch intelligibility
Synopsis:
Sonority is a central notion in phonetics and phonology and it is essential for generalizations related to syllabic organization. However, to date there is no clear consensus on the phonetic basis of sonority, neither in perception nor in production. The widely used Sonority Sequencing Principle (SSP) represents the speech signal as a sequence of discrete units, where phonological processes are modeled as symbol manipulating rules that lack a temporal dimension and are devoid of inherent links to perceptual, motoric or cognitive processes. The current work aims to change this by outlining a novel approach for the extraction of continuous entities from acoustic space in order to model dynamic aspects of phonological perception. It is used here to advance a functional understanding of sonority as a universal aspect of prosody that requires pitch-bearing syllables as the building blocks of speech.
This book argues that sonority is best understood as a measurement of pitch intelligibility in perception, which is closely linked to periodic energy in acoustics. It presents a novel principle for sonority-based determinations of well-formedness – the Nucleus Attraction Principle (NAP). Two complementary NAP models independently account for symbolic and continuous representations and they mostly outperform SSP-based models, demonstrated here with experimental perception studies and with a corpus study of Modern Hebrew nouns.
This work also includes a description of ProPer (Prosodic Analysis with Periodic Energy). The ProPer toolbox further exploits the proposal that periodic energy reflects sonority in order to cover major topics in prosodic research, such as prominence, intonation and speech rate. The book is finally concluded with brief discussions on selected topics: (i) the phonotactic division of labor with respect to /s/-stop clusters; (ii) the debate about the universality of sonority; and (iii) the fate of the classic phonetics–phonology dichotomy as it relates to continuity and dynamics in phonology
Asymmetries in English Vowel Perception Mirror Compression Effects
A series of vowel-identification experiments using gated consonant stimuli shows that English listeners are capable of recovering the vocalic context in which a consonant appears from information contained in the consonant alone. This is true for most consonants tested, including liquids, nasals, and stops in onset and coda position. Positional asymmetries in vowel sensitivity go in opposite directions for liquids (coda sensitivity \u3e onset) and stops (onset \u3e coda). Nasals pattern with liquids in terms of vowel sensitivity from consonant steady states alone, but pattern more closely with stops when portions outside the steady-state are taken into account. It is argued that these asymmetries are related to patterns of cluster-driven vowel compression (also called ‘compensatory shortening’) in speech production
Temporal and spectral parameters in perception of the voicing contrast in English and Polish
Niniejsza praca koncentruje się na czasowych i spektralnych parametrach percepcji
dźwięczności w języku angielskim i polskim. Metodologia badań oparta została na akustycznej
manipulacji parametrami temporalnymi i spektralnymi, które biorą udział w implementacji
kontrastu dźwięczności w badanych językach. Porównane zostały trzy grupy
badanych: początkujący uczący się języka angielskiego, zaawansowani użytkownicy języka
angielskiego oraz rodowici użytkownicy języka angielskiego. Praca składa się z dwóch części
teoretycznych, ilustrujących problematykę i zestawiających z sobą różne strategie implementacji
kontrastu dźwięczności w badanych językach, oraz części badawczej, prezentującej
zastosowaną metodologię badań i analizę wyników.
Część pierwsza porusza problem roli percepcji mowy w badaniach językoznawczych.
Dotyka takich aspektów jak brak bezpośredniej relacji między sygnałem dźwiękowym a kategorią
fonologiczną, wyjątkowa plastyczność i zdolność adaptacyjna ludzkiej percepcji
mowy, a także referuje propozycje dotyczące kompleksowego opisu działania ludzkiej percepcji
mowy. W kolejnych podrozdziałach praca omawia percepcję w kontekście kontaktu
językowego, a więc rozróżnianie kontrastów dźwiękowych występujących w języku obcym,
ale nieobecnych w języku pierwszym. Zostają również zrecenzowane modele, które taki
proces opisują, jak i hipotezy dotyczące potencjalnego sukcesu w opanowaniu efektywnej
percepcji kontrastów dźwiękowych występujących w języku obcym.
Część druga pracy koncentruje się na różnicach temporalnych i akustycznych w implementacji
dźwięczności w języku angielskim i polskim. Opisane zostały aspekty, takie jak:
parametr VOT, długość samogłoski, długość zwarcia, długość frykcji, ubezdźwięcznienie,
długość wybuchu.
Cześć trzecia, badawcza, prezentuje materiał wykorzystany podczas badania percepcji,
metodologię manipulacji tym materiałem oraz charakterystykę grup osób poddanych badaniom.
Hipotezy oparte na założeniach teoretycznych są następnie weryfikowane na podstawie
otrzymanych wyników. Część końcowa omawia problemy percepcyjne, jakie spotykają
Polaków uczących się języka angielskiego, oraz zawiera wnioski dydaktyczne
Experimental phonetic study of the timing of voicing in English obstruents
The treatment given to the timing of voicing in three areas of phonetic
research -- phonetic taxonomy, speech production modelling, and speech
synthesis -- Is considered in the light of an acoustic study of the timing of
voicing in British English obstruents. In each case, it is found to be deficient.
The underlying cause is the difficulty in applying a rigid segmental approach to
an aspect of speech production characterised by important inter-articulator
asynchronies, coupled to the limited quantitative data available concerning the
systematic properties of the timing of voicing in languages.
It is argued that the categories and labels used to describe the timing of
voicing In obstruents are Inadequate for fulfilling the descriptive goals of
phonetic theory. One possible alternative descriptive strategy is proposed,
based on incorporating aspects of the parametric organisation of speech into
the descriptive framework. Within the domain of speech production modelling,
no satisfactory account has been given of fine-grained variability of the timing
of voicing not capable of explanation in terms of general properties of motor
programming and utterance execution. The experimental results support claims
In the literature that the phonetic control of an utterance may be somewhat
less abstract than has been suggestdd in some previous reports. A schematic
outline is given, of one way in which the timing of voicing could be controlled
in speech production. The success of a speech synthesis-by-rule system
depends to a great extent on a comprehensive encoding of the systematic
phonetic characteristics of the target language. Only limited success has been
achieved in the past thirty years. A set of rules is proposed for generating
more naturalistic patterns of voicing in obstruents, reflecting those observed in
the experimental component of this study. Consideration Is given to strategies
for evaluating the effect of fine-grained phonetic rules In speech synthesis
Transphonologization of voicing in Chru:Studies in production and perception
Chru, a Chamic language of south-central Vietnam, has been described as combining contrastive obstruent voicing with incipient registral properties (Fuller, 1977). A production study reveals that obstruent voicing has already become optional and that the voicing contrast has been transphonologized into a register contrast based primarily on vowel height (F1). An identification study shows that perception roughly matches production in that F1 is the main perceptual cue associated with the contrast. Structured variation in production suggests a sound change still in progress: While younger speakers largely rely on vowel height to produce the register contrast, older male speakers maintain a variety of secondary properties, including optional closure voicing. Our results shed light on the initial stages of register formation and challenge the claim that register languages must go through a stage in which breathiness or aspiration is the primary contrastive property (Haudricourt, 1965; Wayland & Jongman, 2002; Thurgood, 2002). This article also complements several recent studies about the transphonologization of voicing in typologically diverse languages (Svantesson & House, 2006; Howe, 2017; Coetzee, Beddor, Shedden, Styler, & Wissing, 2018)
Perception of English and Polish obstruents
Praca niniejsza koncentruje się na kontraście dźwięczna-bezdźwięczna w percepcji angielskich i polskich spółgłosek właściwych. Metodologia badań oparta została na manipulacji akustycznej parametrów temporalnych i spektralnych, które biorą udział w implementacji kontrastu dźwięczności w badanych językach. Porównane zastałych trzy grupy badanych – początkujący uczący się języka angielskiego, zaawansowani
użytkownicy języka angielskiego, oraz rodowici mówcy języka angielskiego. Praca składa się z dwóch części teoretycznych, ilustrujących problematykę i kontrastujących strategie implementacji kontrastu dźwięczności w badanych językach, oraz części badawczej, prezentującej zastosowaną metodologię badań oraz analizę wyników. Część pierwsza porusza problem roli percepcji mowy w badaniach językoznawczych.
Dotyka takich aspektów jak brak bezpośredniej relacji między sygnałem dźwiękowym a kategorią fonologiczną, wyjątkowa plastyczność i zdolność adaptacyjna ludzkiej percepcji mowy, oraz referuje propozycje dotyczące kompleksowego opisu działania ludzkiej percepcji mowy. W kolejnych podrozdziałach praca omawia percepcję w
kontekście kontaktu językowego, a więc rozróżnianie kontrastów akustycznych występujących w języku obcym, ale nieobecnych w języku pierwszym. Zostają również zrecenzowane modele, które taki proces opisują, jak i hipotezy opisujące potencjalny sukces w opanowaniu efektywnej percepcji kontrastów percepcyjnych występujących w języku obcym. Część druga koncentruje się na różnicach temporalnych i akustycznych w
implementacji dźwięczności w języku angielskim i polskim. Opisane zostają aspekty takie jak; Voice Onset Time, długość samogłoski, długość zwarcia, długość frykcji, ubezdźwięcznienie, długość wybuchu.
Cześć trzecia, badawcza, prezentuje materiał poddany badaniu, metodologię manipulacji materiału, oraz charakterystykę grup. Hipotezy oparte na założeniach teoretycznych są następnie weryfikowane przy pomocy otrzymanych wyników. Część końcowa omawia problemy percepcyjne, jakie spotykają Polaków uczących się języka angielskiego oraz wyciąga wnioski pedagogiczne
- …