4 research outputs found

    Alleviating the one-to-many mapping problem in voice conversion with context-dependent modelling

    No full text
    International audienceThis paper addresses the "one-to-many" mapping problem in Voice Conversion (VC) by exploring source-to-target mappings in GMM-based spectral transformation. Specifically, we examine differences using source-only versus joint source/target information in the classification stage of transformation, effectively illustrating a "one-to-many effect" in the traditional acoustically-based GMM. We propose combating this effect by using phonetic information in the GMM learning and classification. We then show the success of our proposed context-dependent modeling with transformation results using an objective error criterion. Finally, we discuss implications of our work in adapting current approaches to VC

    Codificación y compresión de señales de voz con cuantización vectorial no determinística

    Get PDF
    En los sistemas de transmisión [1] actuales es de vital importancia garantizar la integridad de la información y a su vez, que ésta se encuentre protegida de cualquier ambiente externo que exponga la misma a fuentes no deseadas. Por esto la codificación se ha convertido en una de las herramientas más importantes para garantizar la seguridad y exclusividad de la información entre su origen y destino; frecuentemente encontramos que las señales que involucran información son de tamaños mayores y, por lo tanto, su procesamiento y transmisión es más complicado, por esto la alternativa de utilizar métodos de compresión de datos también es usada frecuentemente; en este artículo es utilizada la técnica de cuantización vectorial no determinística para codificar y comprimir la información. De la misma forma, es posible encontrar que al elevar el grado de compresión e implementar algoritmos de codificación se encuentran problemas que comprometen la calidad de la información, es posible que al querer recuperar los datos originales características propias del procesamiento de datos generan pérdidas en la inteligibilidad de la señal original, para esto son utilizadas técnicas diversas como el algoritmo LMS de filtrado adaptativo y así obtener un aprovechamiento significativo

    Conditional Vector Quantization for Voice Conversion

    No full text
    corecore