Search CORE

2 research outputs found

PEMBANGKITAN PROSODY PADA TEXT-TO-SPEECH SYNTHESIS SYSTEM UNTUK PENUTUR BERBAHASA INDONESIA

Author: Rugmiaga Zonda
Publication venue: EEPIS
Publication date: 29/07/2011
Field of study

Text-To-Speech Synthesis System adalah sebuah konverter tulisan menjadi sebuah ucapan/audio(spoken language) yang bisa di dengar oleh user. Proses untuk membuat Text-To-Speech Synthesis System ini terdapat tiga tahap, yaitu pre-text processing, prosody dan concatenation. Pada proyek akhir “Pembangkitan Prosody Text-To-Speech Synthesis System untuk penutur berbahasa Indonesia”, khusus mengerjakan dalam proses prosody pada setiap ujung-ujung persambungan antar diphone nya. Di dalam proses prosody ini, terdapat beberapa tahap yang harus di lakukan. Yaitu the multi level data structure, diphone retrieval dan accouctic manipulation. Melalui proses prosody di setiap ujung-ujung persambungan akan dilakukan proses PSOLA untuk memperhalus transisi antar sinyal diphone. Pada pengujiannya menggunakan pitch countour didapatkan hasil bahwa overlap 30% memiliki Pitch countour yang lebih bagus dengan jumlah lebih sedikit sinyal drop pada sambungannya bila di bandingan dengan penyambungan menggunakan overlap 50% dan 70%. Pengujian dengan survey kepada 20 responden , overlap 30%, mendapatkan nilai MOS 2.85 untuk overlap 30%, overlap 50% mendapatkan nilai MOS 2.81 dan overlap 70% mendapatkan nilai MOS 2.79. sehingga,penggunaan overlap 30% lebih bagus hasilnya bila dibandingkan dengan menggunakan overlap 50% dan 70%. Kata Kunci : Text-To-Speech Synthesis System , prosody , diphone , pitch countour

EEPIS Repository

Pembuatan Text-To-Speech Synthesis System Untuk Penutur Berbahasa Indonesia

Author: Handi Dwi Rachma
Miftahul Huda
Zonda Rugmiaga
Publication venue
Publication date: 26/10/2011
Field of study

Perkembangan teknologi telekomunikasi yang sangat pesat dihasilkan berbagai produk teknologi telekomunikasi yang sangat beragam. Produk telekomunikasi yang dihasilkan dari waktu ke waktu merupakan produk yang lebih efektif dan efisien dalam hal penggunaan dan pemeliharaan, baik secara teknis maupun biaya. Pada paper ini diusulkan suatu metode diphone concatenation untuk mengkonversikan penulisan teks pada PC atau laptop menjadi output suara sesuai dengan teks yang dituliskan. Pembuatan ini dilakukan dengan menggunakan metode synthesis system yang terdiri dari tiga proses yaitu text pre processing, pembangkitan prosody dan proses concatenation. Pembuatan perangkat lunak ini didahului dengan perancangan sistem aplikasi, kemudian rancangan tersebut diimplementasikan dengan text to speech synthesis system yang terdiri dari proses text pre processing, pembangkitan prosody, dan proses concatenation. Setelah diimplementasikan, perangkat lunak ini diuji coba sesuai dengan spesifikasi kebutuhan dan kemampuan yang dimiliki yaitu melakukan pengkonversian dari input kata atau kalimat ke bentuk representasi diphone yang kemudian diphone-diphone tersebut akan disambungkan (concatenate) untuk menjadi suara seperti teks yang diinputkan. Dengan demikian aplikasi perangkat lunak ini dapat digunakan untuk membantu para tuna netra agar dapat membaca berita dari internet ataupun membaca email.

EEPIS Repository