5 research outputs found

    Broad phonetic class definition driven by phone confusions

    Get PDF
    Intermediate representations between the speech signal and phones may be used to improve discrimination among phones that are often confused. These representations are usually found according to broad phonetic classes, which are defined by a phonetician. This article proposes an alternative data-driven method to generate these classes. Phone confusion information from the analysis of the output of a phone recognition system is used to find clusters at high risk of mutual confusion. A metric is defined to compute the distance between phones. The results, using TIMIT data, show that the proposed confusion-driven phone clustering method is an attractive alternative to the approaches based on human knowledge. A hierarchical classification structure to improve phone recognition is also proposed using a discriminative weight training method. Experiments show improvements in phone recognition on the TIMIT database compared to a baseline system

    Evaluación de las causas sociales y efectos ambientales del cambio de uso de suelo en la cuenca del Río Mira

    Get PDF
    Evaluar las causas sociales y efectos ambientales del cambio de uso de suelo en la cuenca media-alta del río Mira con el fin de generar estrategias para el ordenamiento territorial.El reemplazo de coberturas naturales a causa del incremento de actividades antrópicas ha generado cambio de uso de suelo, por lo cual, la presente investigación tuvo como objetivo Evaluar las causas sociales y efectos ambientales del cambio de uso de suelo en la cuenca media-alta del río Mira ubicada en el norte del Ecuador. Para ello, se realizaron entrevistas a actores claves en diferentes niveles jerárquicos como: representantes de comunidades, sectores económicos y gobiernos locales. Posteriormente se determinaron los cambios de cobertura mediante un análisis multitemporal de dos imágenes satelitales LANDSAT. Además, mediante el índice de calidad ambiental se identificaron los efectos ambientales en el territorio para el período 1996-2018. Posteriormente, se aplicó la metodología Presión-Estado-Respuesta, donde como indicadores de “presión” se utilizó a los factores impulsores del cambio de uso de suelo, como indicadores de “estado” se usaron los cambios que subsisten en la cobertura y como indicadores de “respuesta” se diseñó estrategias de uso sustentable de suelo. Como resultado se identificaron impulsores del cambio a los factores: demográficos, económicos, institucionales, tecnológicos y culturales. Para el período 1996-2018, se determinaron cambios de cobertura como reducción de bosques (7.91%) y vegetación arbustiva (14.21%) a causa del aumento de pastos (0.61%) y cultivos (21.99%). Se determinó efecto ambiental negativo sobre las coberturas bosques, páramos y vegetación arbustiva, disminuyendo en un 2.72% la calidad del territorio. Las estrategias en base a los impulsores del cambio y al estado actual del territorio son: Restauración ecológica en zonas degradadas, Política de desarrollo rural para reducir la migración, Optimización tecnológica agrícola, Regulación de desarrollo urbano, avance agrícola y minero, Prácticas de conservación de suelo y agua, Fortalecimiento de asociaciones agrícolas y Educación Agroambiental.Ingenierí

    Multilingual Phoneme Models for Rapid Speech Processing System Development

    Get PDF
    Current speech recognition systems tend to be developed only for commercially viable languages. The resources needed for a typical speech recognition system include hundreds of hours of transcribed speech for acoustic models and 10 to 100 million words of text for language models; both of these requirements can be costly in time and money. The goal of this research is to facilitate rapid development of speech systems to new languages by using multilingual phoneme models to alleviate requirements for large amounts of transcribed speech. The Global Phone database, winch contains transcribed speech from 15 languages, is used as source data to derive multilingual phoneme models. Various bootstrapping processes arc used to develop an Arabic speech recognition system starting from monolingual English models, International Phonetic Association (IP based multilingual models, and data-driven multilingual models. The Kullback-Leibler distortion measure is used to derive data-driven phoneme clusters. It was found that multilingual bootstrapping methods outperform monolingual English bootstrapping methods on the Arabic evaluation data initially, and after three iterations of bootstrapping all systems show similar performance levels
    corecore