Rejtett Markov-modell alapú szövegfelolvasó adaptációja félig spontán magyar beszéddel

Abstract

Napjainkban számos automatikus szövegfelolvasási módszer létezik, de az elmúlt években a legnagyobb figyelmet a statisztikai parametrikus beszédkeltési módszer, ezen belül is a rejtett Markov-modell (Hidden Markov Model, HMM) alapú szövegfelolvasás kapta. A HMM-alapú szövegfelolvasás minsége megközelíti a manapság legjobbnak számító elemkiválasztásos szintézisét, és ezen túl számos elnnyel rendelkezik: adatbázisa kevés helyet foglal el, lehetséges új hangokat külön felvételek nélkül létrehozni, érzelmeket kifejezni vele, és már néhány mondatnyi felvétel esetén is lehetséges az adott beszél hangkarakterét visszaadni. Jelen cikkben bemutatjuk a HMM-alapú beszédkeltés alapjait, a beszéladaptációjának lehetségeit, a magyar nyelvre elkészült beszélfüggetlen HMM adatbázist és a beszéladaptáció folyamatát félig spontán magyar beszéd esetén. Az eredmények kiértékelése céljából meghallgatásos tesztet végzünk négy különböz hang adaptációja esetén, melyeket szintén ismertetünk a cikkünkben

    Similar works