Este artículo describe el proceso de generación de una voz
en castellano utilizando el corpus UPC ESMA de UPC
proporcionado por la Evaluación Albayzín 2008: Conversión
Texto a Voz. Se ha implementado una voz basada
en selección de unidades mediante el paquete Multisyn
de Festival y otra basada en Hidden Semi-Markov Models
(HSMM) mediante HTS. Tras una breve evaluación
de la calidad de ambas voces, se detallan las características
principales de la voz basada en HSMM, sistema final
presentado a la evaluación