Metoda pro segmentaci audio signálů podle řečníka

Abstract

Článek se zabývá úlohou segmentace nahrávky podle řečníka. Cílem úlohy je vydělit z nahrávky úseky, z nichž každý obsahuje co nejdelší promluvu vyslovenou pouze jedniným řečníkem. Metoda popsaná v tomto článku nepotřebuje žádné apriorní znalosti o řečníkovi ani o charakteristikách řečového signálu.The paper deals with the problem of speaker-based segmentation. The goal of this task is to extract homogeneous segments containing the longest possible utterances produced by a single speaker. In the method presented here, no assumption is made about prior knowledge of the speaker or speech signal characteristics (there is no speaker model, no speech model, even the number of speakers in the recording is not known)

    Similar works