257 research outputs found

    Recognizing Voice Over IP: A Robust Front-End for Speech Recognition on the World Wide Web

    Get PDF
    The Internet Protocol (IP) environment poses two relevant sources of distortion to the speech recognition problem: lossy speech coding and packet loss. In this paper, we propose a new front-end for speech recognition over IP networks. Specifically, we suggest extracting the recognition feature vectors directly from the encoded speech (i.e., the bit stream) instead of decoding it and subsequently extracting the feature vectors. This approach offers two significant benefits. First, the recognition system is only affected by the quantization distortion of the spectral envelope. Thus, we are avoiding the influence of other sources of distortion due to the encoding-decoding process. Second, when packet loss occurs, our front-end becomes more effective since it is not constrained to the error handling mechanism of the codec. We have considered the ITU G.723.1 standard codec, which is one of the most preponderant coding algorithms in voice over IP (VoIP) and compared the proposed front-end with the conventional approach in two automatic speech recognition (ASR) tasks, namely, speaker-independent isolated digit recognition and speaker-independent continuous speech recognition. In general, our approach outperforms the conventional procedure, for a variety of simulated packet loss rates. Furthermore, the improvement is higher as network conditions worsen.Publicad

    A Comparison of Front-Ends for Bitstream-Based ASR over IP

    Get PDF
    Automatic speech recognition (ASR) is called to play a relevant role in the provision of spoken interfaces for IP-based applications. However, as a consequence of the transit of the speech signal over these particular networks, ASR systems need to face two new challenges: the impoverishment of the speech quality due to the compression needed to fit the channel capacity and the inevitable occurrence of packet losses. In this framework, bitstream-based approaches that obtain the ASR feature vectors directly from the coded bitstream, avoiding the speech decoding process, have been proposed ([S.H. Choi, H.K. Kim, H.S. Lee, Speech recognition using quantized LSP parameters and their transformations in digital communications, Speech Commun. 30 (4) (2000) 223–233. A. Gallardo-Antolín, C. Pelàez-Moreno, F. Díaz-de-María, Recognizing GSM digital speech, IEEE Trans. Speech Audio Process., to appear. H.K. Kim, R.V. Cox, R.C. Rose, Performance improvement of a bitstream-based front-end for wireless speech recognition in adverse environments, IEEE Trans. Speech Audio Process. 10 (8) (2002) 591–604. C. Peláez-Moreno, A. Gallardo-Antolín, F. Díaz-de-María, Recognizing voice over IP networks: a robust front-end for speech recognition on the WWW, IEEE Trans. Multimedia 3(2) (2001) 209–218], among others) to improve the robustness of ASR systems. LSP (Line Spectral Pairs) are the preferred set of parameters for the description of the speech spectral envelope in most of the modern speech coders. Nevertheless, LSP have proved to be unsuitable for ASR, and they must be transformed into cepstrum-type parameters. In this paper we comparatively evaluate the robustness of the most significant LSP to cepstrum transformations in a simulated VoIP (voice over IP) environment which includes two of the most popular codecs used in that network (G.723.1 and G.729) and several network conditions. In particular, we compare ‘pseudocepstrum’ [H.K. Kim, S.H. Choi, H.S. Lee, On approximating Line Spectral Frequencies to LPC cepstral coefficients, IEEE Trans. Speech Audio Process. 8 (2) (2000) 195–199], an approximated but straightforward transformation of LSP into LP cepstral coefficients, with a more computationally demanding but exact one. Our results show that pseudocepstrum is preferable when network conditions are good or computational resources low, while the exact procedure is recommended when network conditions become more adverse.Publicad

    Band-pass filtering of the time sequences of spectral parameters for robust wireless speech recognition

    Get PDF
    In this paper we address the problem of automatic speech recognition when wireless speech communication systems are involved. In this context, three main sources of distortion should be considered: acoustic environment, speech coding and transmission errors. Whilst the first one has already received a lot of attention, the last two deserve further investigation in our opinion. We have found out that band-pass filtering of the recognition features improves ASR performance when distortions due to these particular communication systems are present. Furthermore, we have evaluated two alternative configurations at different bit error rates (BER) typical of these channels: band-pass filtering the LP-MFCC parameters or a modification of the RASTA-PLP using a sharper low-pass section perform consistently better than LP-MFCC and RASTA-PLP, respectively.Publicad

    Perspectivas de la comunicación intercultural en la enseñanza y el aprendizaje de lenguas extranjeras

    Get PDF
    This article focuses on the intercultural approaches to teaching English as a Foreign Language (EFL) in Spain. Within communication and linguistic uses, we relate the concepts of communicative competence (Byram, 1997) to an intercultural speaker (Kramsch, 1998) with both learning and teaching at our technological educational context. These concepts will be approached from an intercultural perspective. In order to help future speakers of a language overcome above appointed issues, the idea is to set the theoretical foundation which helps us to elaborate an Academic Program bearing in mind how interculturality leads to different uses of grammar in L1 and L2. The main results will lead to adjusting EFL to current legislation, raise awareness on how interculturality is a really strong tool to understand grammar and on current limitations and further research to be done on this subject.Este artículo se centra en los enfoques interculturales en la enseñanza del inglés como lengua extranjera (EFL) en España. En el marco de la comunicación y los usos lingüísticos, relacionamos los conceptos de competencia comunicativa (Byram, 1997) con el de hablante intercultural (Kramsch, 1998) y ambos a su vez con la enseñanza y aprendizaje con el contexto educativo y tecnológico. Estos conceptos se analizarán desde una perspectiva intercultural. Con la intención de ayudar a futuros hablantes a superar tales dificultades, la idea es establecer una base teórica que nos ayudará a elaborar una programación didáctica que tenga en cuenta como la interculturalidad lleva a diferentes usos de la gramática en las L1 y L2. Los resultados principales nos llevarán a un ajuste del EFL a la legislación vigente, a la concienciación de cómo la interculturalidad es una herramienta muy potente para entender las reglas gramaticales de una cultura meta, y un análisis de las limitaciones y de futuras investigaciones a realizar en este ámbito

    Métodos analíticos para el estudio de Legionella

    Get PDF
    Assays for Legionella detection in water samples are one of the aspects included in the Spanish legislation on prevention of Legionnaires ́ disease. The frequency of these assays, laboratories that carry out them, and the required actions that derive from them, regarding colony counts, are included in the maintenance plans when Legionella prevention is carried out in water installations (Real Decree 865/2003). The comparison of our legislation with other legislations or recommendations adopted in other countries (United Kingdom, France, Australia, America) allows to know our degree of demand of some parameters. Bacteria culture is the gold standard method for Legionella detection in water samples, and and there are several normalized assays, such as ISO 11731/98 and 2004 or NF T 90-431/2003 (AFNOR). To help the interpretation of the results, Legionella assays should reflect the standard in which they are based and the limit of detection of the method, that should not be over 100 ufc/L. Moreover, laboratories that carry out these assays should be acredited by our national accreditation body (ENAC). In the last years, fast methods have been developed for Legionella detection based on the amplification of chromosomal DNA in water samples by PCR reactions. PCR assays should not be used alone, but it should be a complement of culture assays, when normative actions are implemented in water installations.Los ensayos para la determinación de Legionella en muestras de agua son uno de los aspectos contemplados en la legislación española sobre prevención de legionelosis. La periodicidad de estos ensayos en función del tipo de instalación, los laboratorios que los realizan, y las acciones correctoras que derivan de ellos en función de los recuentos bacterianos son acciones incluidas en los planes de mantenimiento preventivo de las instalaciones consideradas de riesgo (Real Decreto 865/2003). La comparación de nuestra legislación con otras legislaciones o recomendaciones adoptadas en otros paises (Reino Unido, Francia, Australia, América) permite conocer nuestro grado de exigencia en relación a algunos de los parámetros contemplados. El cultivo de la bacteria es el método de referencia para la detección de Legionella en muestras de agua y existen varios ensayos normalizados, como los estándares ISO 11731/98 y 2004 y NF T 90- 431/2003 (AFNOR). Para ayudar a la interpretación de los resultados, los ensayos deben reflejar el estándar en el que se basan y el límite de detección del método, que no debe ser superior a 100 ufc/L. Además, los laboratorios que realizan estos ensayos deben estar acreditados por nuestra entidad de acreditación ENAC. En los últimos años se han desarrollado métodos rápidos de detección de la bacteria basados en la amplificación de ADN cromosómico en muestras de agua mediante reacciones de PCR. El desarrollo científico de estos métodos va por delante del desarrollo reglamentario, y los ensayos de PCR no deben desplazar a los ensayos de cultivo en cumplimiento de las normativas vigentes, sino que deben complementarlo

    Variabilidad inter-individual e inter-familiar en tasa de crecimiento en Ruditapes decussatus

    Get PDF
    [ES] Se han analizado las diferencias inter-familiares e intra-familiares en los parámetros del balance energético en individuos juveniles pertenecientes a cuatro familias de la especie de almeja Ruditapes decussatus. Las familias se produjeron en el centro de investigación Instituto de Investigación y Tecnología Agroalimentarias (IRTA) de San Carles de la Rápita (Tarragona) y se mantuvieron bajo condiciones idénticas durante un periodo, en el cual se logró una alta dispersión de tamaños (longitud de concha: de 1 a 12 mm). Muestras de estas familias se trasladaron al laboratorio, donde se clasificaron los individuos de cada familia en grupos de diferentes tamaños (tallas SS, S, M y L). Con esos individuos se realizaron análisis de los parámetros fisiológicos del balance energético: tasa de aclaramiento (CR) y consumo de oxígeno (VO2), que representan los procesos de ganancia y pérdida de energía respectivamente. En tres de las familias, las tasas fisiológicas específicas (por unidad de masa) no fueron significativamente distintas entre individuos de diferentes tallas: el exponente de masa en las relaciones alométricas de CR y VO2 con el tamaño corporal fue cercano a 1. Este resultado contrasta con los obtenidos en la generalidad de los análisis alométricos de las tasas fisiológicas en bivalvos. En el trabajo se han discutido las implicaciones que estos resultados tienen en la explicación de las diferencias intra-familiares en tasa de crecimiento. En una de las familias, el exponente de masa para CR (0,753) fue significativamente inferior al de VO2 (1,184), lo que indica que la capacidad de filtrar se reduce con el tamaño corporal en mayor medida que en las otras familias. Este resultado explica las menores tallas halladas en esa familia con respecto a las otras

    Variabilidad inter-individual e inter-familiar en tasa de crecimiento en Ruditapes decussatus

    Get PDF
    [ES] Se han analizado las diferencias inter-familiares e intra-familiares en los parámetros del balance energético en individuos juveniles pertenecientes a cuatro familias de la especie de almeja Ruditapes decussatus. Las familias se produjeron en el centro de investigación Instituto de Investigación y Tecnología Agroalimentarias (IRTA) de San Carles de la Rápita (Tarragona) y se mantuvieron bajo condiciones idénticas durante un periodo, en el cual se logró una alta dispersión de tamaños (longitud de concha: de 1 a 12 mm). Muestras de estas familias se trasladaron al laboratorio, donde se clasificaron los individuos de cada familia en grupos de diferentes tamaños (tallas SS, S, M y L). Con esos individuos se realizaron análisis de los parámetros fisiológicos del balance energético: tasa de aclaramiento (CR) y consumo de oxígeno (VO2), que representan los procesos de ganancia y pérdida de energía respectivamente. En tres de las familias, las tasas fisiológicas específicas (por unidad de masa) no fueron significativamente distintas entre individuos de diferentes tallas: el exponente de masa en las relaciones alométricas de CR y VO2 con el tamaño corporal fue cercano a 1. Este resultado contrasta con los obtenidos en la generalidad de los análisis alométricos de las tasas fisiológicas en bivalvos. En el trabajo se han discutido las implicaciones que estos resultados tienen en la explicación de las diferencias intra-familiares en tasa de crecimiento. En una de las familias, el exponente de masa para CR (0,753) fue significativamente inferior al de VO2 (1,184), lo que indica que la capacidad de filtrar se reduce con el tamaño corporal en mayor medida que en las otras familias. Este resultado explica las menores tallas halladas en esa familia con respecto a las otras

    Desertificación: un problema global

    Get PDF
    Los R.RN.N., junto con la preservación del ambiente, forman parte de los grandes temas de la humanidad y se presentan ya como una variable al sistema de precios y competitividad, al igual que las ‘barreras ecológicas” como otra forma de proteccionismo. Dentro de este contexto neorganizado se conforman nuevos paradigmas tales como la conservación de la biodiversidad, el cambio climático global, la desertificación y la explotación sostenible de la naturaleza, los cuales son verdaderos ejes centrales alrededor de los cuales se dirime y estructura el nuevo orden internacional. El patrimonio de la biosfera y de las culturas es común a todos y nos concierne por igual por lo cual debe ser un pacto intergeneracional e intercultural. Es que el sentido del ecologismo está en que la población de ahora y del futuro tengan la libertad de escoger su modo de vida para no enfrentarse a un mundo perturbado y carente de recursos. El mayor reto ecológico es la igualdad entre las personas y las sociedades del planeta.Academia Nacional de Agronomía y Veterinari

    Morphological processing of a dynamic compressive gammachirp filterbank for automatic speech recognition

    Get PDF
    Actas de: VII Jornadas en Tecnología del Habla and III Iberian SLTECH Workshop (IberSPEECH 2012). Madrid, 21-23 noviembre 2012.The Dynamic Compressive Gammachirp is presented for producing auditory-inspired feature extraction in Automatic Speech Recognition. The proposed acoustic features combine spectral subtraction and two-dimensional non-linear filtering technique most usually employed for image processing: morphological filtering. These features have been proven to be more robust to noisy speech than those based on simpler auditory filterbanks like the classical mel-scaled triangular filterbank, the Gammatone filterbank and the passive Gammachirp in a noisy Isolet database.This work has been partially supported by the Spanish Ministry of Science and Innovation CICYT Projects No. TEC2008-06382/TEC and No. TEC2011-26807.Publicad
    corecore