3 research outputs found

    Speaker identity indicators in the domain of the temporal modulation of the speech signal

    AbstraktAbstraktAbstraktAbstrakt Tato diplomová práce se zabývá rozpoznáváním mluvčího, a to konkrétně v oblasti temporálních změn v řečovém signálu. Po krátkém úvodu do forenzní fonetiky podává přehled přístupů a faktorů, které napomáhají nebo naopak zabraňují úspěšnému rozpoznání. Následně jsou představeny současné přístupy k temporální struktuře řeči a především k metodám její analýzy. Praktickou část práce pak tvoří experiment, který zjišťuje přínos některých temporálních ukazatelů k rozpoznávání mluvčího. Tyto ukazatele jsou %V (poměrné zastoupení vokalických intervalů ve větě), ΔV a ΔC (směrodatná odchylka vokalických, respektive konsonantických intervalů v rámci věty), VarcoV a VarcoC (normalizace předchozích ukazatelů vzhledem k průměrnému trvání daných intervalů) a indexy párové variability (PVI) pro vokalické i konsonantické intervaly, normalizované i nenormalizované. Kromě toho je k zachycení lokálních změn tempa a obzvláště závěrového zpomalování použit ukazatel LAR (převrácená hodnota vzdálenosti středů dvou následujících vokalických intervalů). Zatímco první zmíněné ukazatele nejsou v rozlišení mluvčích příliš úspěšné, LAR se zdá být velmi dobrým nástrojem pro zachycení individuálních rysů mluvčích. Pro praktické využití tohoto ukazatele bude ale potřeba další výzkum, zejména na větším vzorku...AbstractAbstractAbstractAbstract This diploma thesis aims to contribute to the field of speaker recognition in the domain of temporal changes in the speech signal. After a brief introduction into forensic phonetics, it gives an outline of approaches and factors which help or hinder successful recognition. The focus is then shifted to the temporal structure of speech and approaches to its analysis currently in use. The practical section of this thesis consists of an experiment designed to assess the contribution of certain temporal measures to speaker recognition. The variables used here are %V (the proportion of vocalic intervals within a sentence), ΔV and ΔC (the standard deviation of the duration of vocalic/consonantal intervals within a sentence), VarcoV and VarcoC (the previous variables normalised for average interval duration) and the Pairwise Variability Indices, both vocalic and consonantal, raw and normalised. Beside these, another variable is used to capture the local articulation rate and especially final deceleration in the utterances - LAR (the inverse of the distance between successive midpoints of the vocalic intervals). Whereas the first mentioned variables are not very successful in distinguishing the speakers, LAR seems very well suited for capturing speaker idiosyncrasies, although...Institute of PhoneticsFonetický ústavFaculty of ArtsFilozofická fakult

    The Lombard Effect's Influence on Automatic Speaker Verification Systems and Methods for its Compensation

