Search CORE

5 research outputs found

Promptgenerátor : ügyfélszolgálati hangos üzenetek automatikus gépi előállítása egy adott bemondó hangjára

Author: Bartalis Mátyás
Fék Márk
Németh Géza
Olaszy Gábor
Zainkó Csaba
Publication venue
Publication date: 01/01/2007
Field of study

Az egyre szélesedő kommunikációs lehetőségekkel rohamosan nő a a telefonos ügyfélszolgálatok terhelése. A tájékoztatás automatizálásához egyre több hangos üzenetet kell elkészíteni, általában ugyanazzal a bemondóval. Ezt a felolvasó személy véges terhelhetősége korlátozza. A cikkben olyan gépi megoldás lehetőségéről számolunk be, amelyik leveszi a munka nagy részét a bemondó válláról, csak ellenőriznie kell a generált üzenet hangzását. A promptgenerátor olyan új beszédtechnológiai megoldás, amilyent még nem készítettek Magyarországon. Tervezése és fejlesztése mind számítógépes nyelvészeti, mind fonetikai és informatikai szempontból új megoldásokat eredményezett. A rendszer, optimális esetben olyan természetes hangminőséget szolgáltat, hogy a hallgató nem veszi észre, hogy gép beszél

University of Szeged

Magyar nyelvű neurális beszédszintézis vizsgálata dialógus helyzetben

Author: Bartalis Mátyás
Csapó Tamás Gábor
Németh Géza
Németh Norbert
Szviridov István
Szász Gábor Krisztián
Zainkó Csaba
Publication venue
Publication date: 01/01/2023
Field of study

Jelen tanulmányban olyan mély neurális hálózat alapú beszédszintetizátor rendszert (DNN-TTS) mutatunk be, amely hangsorozat bemenetet vár és a beszéd hullámformáját két lépésben állítja elő, melspektrogram köztes reprezentációt használva. Részletesen bemutatjuk és összehasonlítotjuk a Tacotron2+WaveGlow és FastPitch+HiFi-GAN (tőlünk független) rendszereket és komponenseiket. A magyar nyelvű adatokon végzett saját kísérletekben három beszélővel (két női és egy férfi) generálunk szintezitált beszédmintákat. Szubjektív, MUSHRA típusú meghallgatásos tesztjeink során a tesztalanyok a DNN-TTS beszédszintetizátorral előállított mondatokat lényegesen természetesebbnek minősítették, mint a HMM-TTS alaprendszert. A szintetizált beszédminták minősége (természetessége) ugyan nem éri el a természetes beszéd szintjét, de közel áll hozzá (Tacotron2: 58%, FastPitch: 73%, természetes: 89%). Összességében a tesztelők a FastPitch rendszert preferálták a Tacotron2-vel szemben természetesség szempontjából. A ChatBot dialógusba ágyazott tesztek eredménye szerint a női beszélők preferáltak, és a DNN-TTS rendszerekkel előállított beszéd érthetőbb, természetesebb, mint a HMM-TTS alaprendszer, és tesztelők a válaszokat is relevánsabbnak és részletesebbnek érezték az alaprendszerhez képest

University of Szeged

Magyar hangsúlyjelölési szöveges adatbázis fejlesztése és referencia-vizsgálata

Author: Abari Kálmán
Bartalis Mátyás
Olaszy Gábor
Publication venue
Publication date: 11/07/2020
Field of study

University of Debrecen Electronic Archive

Human Voice or Prompt Generation? Can they Co-exist in an Application?

Author: Bartalis Mátyás
Kiss Géza
Németh Géza
Olaszy Gábor
Zainkó Csaba
Publication venue
Publication date: 01/09/2009
Field of study

SZTAKI Publication Repository

Magyar nyelvű neurális beszédszintézis vizsgálata dialógus helyzetben

Author: Bartalis Mátyás
Csapó Tamás Gábor
Németh Géza
Németh Norbert
Szviridov István
Szász Gábor Krisztián
Zainkó Csaba
Publication venue: 'SZTE Hungarian Scientific Society of the Silicate Industry'
Publication date: 01/01/2023
Field of study

Repository of the Academy's Library