2 research outputs found


    Get PDF
    本論文は,i-vector / PLDA,x-vector / PLDAに基づく話者照合システムを用いて非線形帯域拡張(N-BWE)法を評価することを目的としている.N-BWE法とは帯域拡張法の一つで,モデル学習を行わず,計算量が非常に軽い手法として提案された.N-BWEは単純な非線形関数とフィルタのみで構成されているにもかかわらず,GMM-UBMに基づく話者照合の等価エラー率(EER)と二乗平均平方根対数スペクトル歪み(RMS-LSD)において高い性能を得られることが報告されている.PLDAに基づく話者照合は話者とチャネルの依存性を分離することに焦点を当てているが,帯域制限による劣化音声を用いた場合については議論されていない.そこで本論文では,i-vector / PLDA,x-vector / PLDAに基づく話者照合システムを構築し,N-Bweや他の帯域拡張法を用いることでサンプリング周波数の違いによる帯域制限のかかった音声がシステムに与える影響について調査し,帯域拡張を適用した音声の客観評価とEERの関係を考察した.実験結果より,N-Bweで生成された音声は低いRMS-LSDを得られ,かつアップサンプリングのみを行なった音声と比較してi-vectorを用いた場合及びx-vectorを用いた場合の話者照合システムどちらにおいてもEERが改善したことを報告する.This paper aims to evaluate an effect of a non-linear bandwidth extension (N-Bwe) method by using i-vector/PLDA-based and x-vector/PLDA-based automatic speaker verification (ASV) systems. The N-Bwe method has been reported as a blind, non-learning and light-weight BWE approach. Although the N-Bwe method consists of a simple non-linear function and lters, it has archived high accuracy in terms of speaker individuality and root mean square log-spectral distortion (RMS-LSD). Recently, i-vector/PLDA-based ASV systems become one of the state-of-the-art ASV systems. While the PLDA-based ASV approaches focus on removing speaker and channel dependency, there are few discussions about speeches which degraded by band limits. Thus, this paper investigates the influence of the speech degradation by band limits toward the PLDA-based ASV systems. In the experiments, the N-Bwe and shift-based BWE methods were evaluated by the PLDA-based ASV systems. From the results, the N-Bwe method improved equal error rate (EER) from the simply up-sampled situation.首都大学東京, 2019-03-25, 修士(工学)首都大学東

    A maximum a Posterior-based reconstruction approach to speech bandwidth expansion in noise

    No full text