Search CORE

5 research outputs found

Speech Recognition System of Slovenian Broadcast News

Author: Sepesy Maučec Mirjam
Žgank Andrej
Publication venue: 'IntechOpen'
Publication date: 13/06/2011
Field of study

IntechOpen

Digital library of University of Maribor

Modeling of Filled Pauses and Onomatopoeas for Spontaneous Speech Recognition

Author: Andrej Zgank
Mirjam Sepesy Maucec
Publication venue: 'IntechOpen'
Publication date: 16/08/2010
Field of study

IntechOpen

Broad phonetic class definition driven by phone confusions

Author: Carla Lopes
Fernando Perdigão
Publication venue: Springer Nature
Publication date: 01/01/2012
Field of study

Intermediate representations between the speech signal and phones may be used to improve discrimination among phones that are often confused. These representations are usually found according to broad phonetic classes, which are defined by a phonetician. This article proposes an alternative data-driven method to generate these classes. Phone confusion information from the analysis of the output of a phone recognition system is used to find clusters at high risk of mutual confusion. A metric is defined to compute the distance between phones. The results, using TIMIT data, show that the proposed confusion-driven phone clustering method is an attractive alternative to the approaches based on human knowledge. A hierarchical classification structure to improve phone recognition is also proposed using a discriminative weight training method. Experiments show improvements in phone recognition on the TIMIT database compared to a baseline system

Crossref

Springer - Publisher Connector

Estudo Geral

Evaluación de las causas sociales y efectos ambientales del cambio de uso de suelo en la cuenca del Río Mira

Author: Córdova Vaca Daniela Estefanía
Gómez Terán Janeth Elizabeth
Publication venue
Publication date: 15/01/2021
Field of study

Evaluar las causas sociales y efectos ambientales del cambio de uso de suelo en la cuenca media-alta del río Mira con el fin de generar estrategias para el ordenamiento territorial.El reemplazo de coberturas naturales a causa del incremento de actividades antrópicas ha generado cambio de uso de suelo, por lo cual, la presente investigación tuvo como objetivo Evaluar las causas sociales y efectos ambientales del cambio de uso de suelo en la cuenca media-alta del río Mira ubicada en el norte del Ecuador. Para ello, se realizaron entrevistas a actores claves en diferentes niveles jerárquicos como: representantes de comunidades, sectores económicos y gobiernos locales. Posteriormente se determinaron los cambios de cobertura mediante un análisis multitemporal de dos imágenes satelitales LANDSAT. Además, mediante el índice de calidad ambiental se identificaron los efectos ambientales en el territorio para el período 1996-2018. Posteriormente, se aplicó la metodología Presión-Estado-Respuesta, donde como indicadores de “presión” se utilizó a los factores impulsores del cambio de uso de suelo, como indicadores de “estado” se usaron los cambios que subsisten en la cobertura y como indicadores de “respuesta” se diseñó estrategias de uso sustentable de suelo. Como resultado se identificaron impulsores del cambio a los factores: demográficos, económicos, institucionales, tecnológicos y culturales. Para el período 1996-2018, se determinaron cambios de cobertura como reducción de bosques (7.91%) y vegetación arbustiva (14.21%) a causa del aumento de pastos (0.61%) y cultivos (21.99%). Se determinó efecto ambiental negativo sobre las coberturas bosques, páramos y vegetación arbustiva, disminuyendo en un 2.72% la calidad del territorio. Las estrategias en base a los impulsores del cambio y al estado actual del territorio son: Restauración ecológica en zonas degradadas, Política de desarrollo rural para reducir la migración, Optimización tecnológica agrícola, Regulación de desarrollo urbano, avance agrícola y minero, Prácticas de conservación de suelo y agua, Fortalecimiento de asociaciones agrícolas y Educación Agroambiental.Ingenierí

Repositorio Digital Universidad Técnica del Norte

Multilingual Phoneme Models for Rapid Speech Processing System Development

Author: Hansen Eric G.
Publication venue: AFIT Scholar
Publication date: 01/09/2006
Field of study

Current speech recognition systems tend to be developed only for commercially viable languages. The resources needed for a typical speech recognition system include hundreds of hours of transcribed speech for acoustic models and 10 to 100 million words of text for language models; both of these requirements can be costly in time and money. The goal of this research is to facilitate rapid development of speech systems to new languages by using multilingual phoneme models to alleviate requirements for large amounts of transcribed speech. The Global Phone database, winch contains transcribed speech from 15 languages, is used as source data to derive multilingual phoneme models. Various bootstrapping processes arc used to develop an Arabic speech recognition system starting from monolingual English models, International Phonetic Association (IP based multilingual models, and data-driven multilingual models. The Kullback-Leibler distortion measure is used to derive data-driven phoneme clusters. It was found that multilingual bootstrapping methods outperform monolingual English bootstrapping methods on the Arabic evaluation data initially, and after three iterations of bootstrapping all systems show similar performance levels

AFTI Scholar (Air Force Institute of Technology)