    EEMD-Based Speaker Automatic Emotional Recognition in Chinese Mandarin

    Ahots murmurikatuaren zenbait ezaugarri akustikoz

    Ikerketa honen helburu nagusia ahots murmurikatuaren zenbait ezaugarri akustiko aztertzea da. Horretarako, lagina 36 esaldik osatzen dute, horietako 18 ahots arruntean gauzatuak eta beste 18ak ahots murmurikatuan. 12 galdera azentuen gauzapena ikertzeko erabili dira eta 6 intonazioarena ikertzeko. [a] bokalaren formakinak aztertzeko esaldi mota guztiak erabili dira (datuen azterketaren atalaren azpiataletan esaldi zehatzak agertuko dira). Inkesta egiteko eduki dugun informatzailea Igorreko 23 urteko andrazko bat izan da. Berorren ama-hizkuntza bertako euskararen barietate tradizionala izan da eta ikasketa guztiak euskaraz egin ditu. Emaitzen artean, hurrengoak dauzkagu: (1) ahots murmurikatuaren ezaugarririk nabarmenenak, ahots arruntaren aldean, f0rik ez egotea eta intonazioa apalagoa izatea dira; (2) iraupenari dagokionez, ahots murmurikatuan eginiko esaldiak luzexeagoak dira, berau estatistikoki esanguratsua izan ez arren; (3) [a] bokalaren formakinen azterketan ahots mota estatistikoki esanguratsua da bokalaren f1 eta f2 formakinei dagokienez; horrela bada, ahots murmurikatuan [a] bokala irekiagoa eta aurreratuagoa da ahots arruntean baino; (4) ahots murmurikatuan azentuaren korrelatu akustiko nagusia iraupena da; (5) silaba azentuduna luzeagoa da azentu bakoa baino; azkenik, (6) adierazpenezkoen eta bai/ez erako galderen bereizkuntzan iraupena eta intonazioa biak erabiltzen dira, baina esaldiaren azken silaban kontraste handiagoa gertatzen da gainerako egonguneetan baino. Bai/ez erako galderen azken silabak luzeagoak eta intentsitate altuagokoak dira adierazpen-esaldienak baino.; The main objective of this research is to analyze the acoustic characteristics of whispered voice. To this end, the sample consists of 36 phrases, of which 18 are produced in modal voice and the other 18 in a whispered voice. We used 12 questions to observe the accent placement and 6 to examine the intonational proprieties and, along with the analysis of vowel formants for [a]. The informant who answered the survey was a 23-year old woman from Igorre. Sentences were produced in her mother tongue, namely, the local variety of Igorre. Results can be summarized as follows: (1) whispered voice shows no f0 along with lower rates of intensity. The most notable characteristics of the murmured voice, compared to the common voice, are the absence of f0 and a lower intonation; (2) with respect to duration, whispered voiced were longer than modal voice; (3) The mean average for vowel formants F1 and F2 were higher for whispered voice, suggesting that [a] is produced more opened and fronted than in modal voice. (4) the main acoustic correlate is duration for whispered voice; (5) the stressed syllable is always longer than the unstressed syllable; finally, (6) in the expressive phrases and in the distinction of the yes / no questions, duration and intensity are used as acoustic correlates of pitch, but in the last syllable of the phrase there is greater contrast. The last syllables of the yes / no questions show longer and with higher intensity than the declarative sentences

    Breathy Voice and Fundamental Frequency: Portraying Gender in The Danish Girl

    This paper investigated how breathy voice and fundamental frequency relate to perceptions of gender and femininity, and how this is portrayed in the movie The Danish Girl. The aim of analysing The Danish Girl was to investigate whether Eddy Redmayne, who plays the main character, a male-to-female transgender person, uses breathy voice and F0 to portray a transition in gender and femininity in the character. While results were not clear-cut, they indicate that Eddy Redmayne has made alterations to his F0 and amount of breathiness. The investigation of how these phenomena are used in The Danish Girl may provide further evidence of how the investigated phenomena are used in real-life, however, it should be acknowledged that The Danish Girl shows merely a portrayal of how these phenomena are used by a character and thus does not necessarily represent how females and male-to-female individuals actually use F0 and breathy voice

    Analysis of the Roles and the Dynamics of Breathy and Whispery Voice Qualities in Dialogue Speech

    Breathy and whispery voices are nonmodal phonations produced by an air escape through the glottis and may carry important linguistic or paralinguistic information (intentions, attitudes, and emotions), depending on the language. Analyses on spontaneous dialogue speech utterances of several speakers show that breathy and whispery voices are related with the expression of a variety of emotion- or attitude-related paralinguistic information. Potential acoustic parameters for characterizing breathy/whispery segments are introduced and used to describe the dynamics of breathiness along the utterances in different paralinguistic items

    Effect of pitch manipulation on the evaluation of credibility in political candidates

    This MA thesis is dealing with the relationship between the pitch of the fundamental frequency of the speaker's voice and the subjective evaluation of the speaker by listeners on a 7point rating scale. The analysis in this thesis was conducted in the form of a perception test in which 39 listeners participated. Participants in the experiment rated the speaker based on how credible the speaker sounded to them. The material was chosen such that the listeners were influenced as little as possible by any possible external influences. The results of the perception test showed a correlation between the type of manipulation and the listeners' evaluations. The hypothesis of the paper was partially confirmed because listeners decreased their average evaluation the higher the f0 value of the item and this relationship was statistically significant. It was also shown that the lower the f0 value of the item, the more credibility evaluations tended to increase, but this change did not prove to be statistically significant. Key words: Fundamental frequency, f0, credibility perception, pitch, perception, votingTato diplomová práce se zabývá vztahem mezi výškou základní frekvence hlasu mluvčího a jeho subjektivním zhodnocením posluchači na 7stupňové hodnotící škále. Analýza byla v této diplomové práci provedena formou percepčního testu, kterého se zúčastnilo 39 posluchačů. Účastníci experimentu hodnotili mluvčí na základě toho, jak důvěryhodně jim daní mluvčí zní. Materiál byl zvolen takový, aby posluchači byli co nejméně ovlivněni externími vlivy. Výsledky percepčního testu ukázaly korelaci mezi typem manipulace a hodnocením posluchačů. Hypotéza práce se potvrdila částečně, protože posluchači snižovali svá průměrná hodnocení čím vyšší byla hodnota f0 položky a tento vztah je statisticky významný. Prokázalo se také, že čím nižší hodnota je f0 položky, tím má hodnocení důvěryhodnosti stoupavou tendenci, tato změna se však neprokázala jako statisticky významná. Klíčová slova: Základní frekvence, f0, vnímání důvěryhodnosti, melodie, percepce, volbyFonetický ústavInstitute of PhoneticsFaculty of ArtsFilozofická fakult

    Időzítési mintázatok a magyar beszédben

    A Beszéd – Kutatás – Alkalmazás sorozat nyolcadik köteteként megjelenő mű egy olyan vizsgálatsorozatot mutat be, amely hiánypótló a magyar beszéddel foglalkozó szakirodalomban. Bár általánosságban a magyar beszéd időzítésével kapcsolatban sok leírás megjelent már, a beszédritmus eddigi megközelítései, az ezzel kapcsolatos korábbi állítások a ritmus sajátosságainak megragadhatatlanságát, a sok változóból adódó bizonytalanságot sugallták, nem véletlenül. A jelenség valóban soktényezős, az adatok gyakran ellentmondásosak, nehéz fogódzókat találni a megfelelő módszertan kialakításához. Kohári Anna azonban vette a bátorságot, hogy erre az ingoványos talajra lépjen, és útját siker koronázta. A nemzetközi szakirodalom széles körének ismeretében új, korábban a (magyar) beszédre még nem alkalmazott módszertanokat használva, különféle metódusokat ötvözve, szorgalmas, aprólékos és szisztematikus elemző munkával jutott el azon eredményekig és megállapításokig, amelyek ebben a kötetben napvilágot látnak, és amelyek a legkorszerűbb ismereteinket foglalják össze a (magyar) beszéd ritmusának vonatkozásában. A kötet bevezetése tananyagként is használható, mivel áttekinti és értelmezi a vonatkozó tudományos fogalomkészletet és terminológiát, továbbá számot ad a nemzetközi és a magyar kutatási eredményekről a legutóbbi időkig bezárólag. A második fejezettől kezdődően a szerző saját kutatásának lépéseit ismerjük meg, az elemzett anyag, az alkalmazott módszerek és az eredmények részletes, jól illusztrált áttekintését kapja az olvasó. Kohári Anna arra is rámutat, hogy a kapott eredmények mely területeken és milyen módon hasznosulhatnak, valamint kijelöli a további kutatások lehetséges irányait is. Mindezek alapján a kötet nemcsak a szűkebb, fonetikusokból álló olvasótábor érdeklődésére tarthat számot, hanem olyan területek művelői is építhetnek a benne foglalt ismeretekre, amelyek a beszéd időzítéséhez bármilyen módon kapcsolódnak, a logopédiától a beszédtechnológiáig. Az a kutatásmódszertani innováció, amelyre a kötet példát ad, azonban még távolabbi, a beszédhez nem vagy kevésbé kapcsolódó, de az időzítés mintázatait magában rejtő jelenségek leírásában is haszonnal kecsegtet. Így a könyv bátran ajánlható a szélesebb érdeklődő közönség számára is