205 research outputs found

    End-to-end Recurrent Denoising Autoencoder Embeddings for Speaker Identification

    Get PDF
    Speech 'in-the-wild' is a handicap for speaker recognition systems due to the variability induced by real-life conditions, such as environmental noise and emotions in the speaker. Taking advantage of representation learning, on this paper we aim to design a recurrent denoising autoencoder that extracts robust speaker embeddings from noisy spectrograms to perform speaker identification. The end-to-end proposed architecture uses a feedback loop to encode information regarding the speaker into low-dimensional representations extracted by a spectrogram denoising autoencoder. We employ data augmentation techniques by additively corrupting clean speech with real life environmental noise and make use of a database with real stressed speech. We prove that the joint optimization of both the denoiser and the speaker identification module outperforms independent optimization of both modules under stress and noise distortions as well as hand-crafted features.Comment: 8 pages + 2 of references + 5 of images. Submitted on Monday 20th of July to Elsevier Signal Processing Short Communication

    Factores influyentes en la actitud del consumidor hacia las plataformas de streaming

    Get PDF
    Mediante el presente estudio, se tiene como objetivo principal analizar los factores influyentes en la actitud del consumidor hacia las plataformas de streaming. Este estudio esta elaborado en castellano

    Building an enhanced vocabulary of the robot environment with a ceiling pointing camera

    Get PDF
    Mobile robots are of great help for automatic monitoring tasks in different environments. One of the first tasks that needs to be addressed when creating these kinds of robotic systems is modeling the robot environment. This work proposes a pipeline to build an enhanced visual model of a robot environment indoors. Vision based recognition approaches frequently use quantized feature spaces, commonly known as Bag of Words (BoW) or vocabulary representations. A drawback using standard BoW approaches is that semantic information is not considered as a criteria to create the visual words. To solve this challenging task, this paper studies how to leverage the standard vocabulary construction process to obtain a more meaningful visual vocabulary of the robot work environment using image sequences. We take advantage of spatio-temporal constraints and prior knowledge about the position of the camera. The key contribution of our work is the definition of a new pipeline to create a model of the environment. This pipeline incorporates (1) tracking information to the process of vocabulary construction and (2) geometric cues to the appearance descriptors. Motivated by long term robotic applications, such as the aforementioned monitoring tasks, we focus on a configuration where the robot camera points to the ceiling, which captures more stable regions of the environment. The experimental validation shows how our vocabulary models the environment in more detail than standard vocabulary approaches, without loss of recognition performance. We show different robotic tasks that could benefit of the use of our visual vocabulary approach, such as place recognition or object discovery. For this validation, we use our publicly available data-set

    Speaker recognition under stress conditions

    Get PDF
    Proceeding of: IberSPEECH 2018, 21-23 November 2018, Barcelona, SpainSpeaker recognition systems exhibit a decrease in performance when the input speech is not in optimal circumstances, for example when the user is under emotional or stress conditions. The objective of this paper is measuring the effects of stress on speech to ultimately try to mitigate its consequences on a speaker recognition task. On this paper, we develop a stress-robust speaker identification system using data selection and augmentation by means of the manipulation of the original speech utterances. An extensive experimentation has been carried out for assessing the effectiveness of the proposed techniques. First, we concluded that the best performance is always obtained when naturally stressed samples are included in the training set, and second, when these are not available, their substitution and augmentation with synthetically generated stress-like samples, improves the performance of the system.This work is partially supported by the Spanish Government-MinECo projects TEC2014-53390-P and TEC2017-84395-P

    Proyecto de diseño e instalación de un parque eólico en la zona boliviana de Qollpana

    Get PDF
    Dentro del marco general de crecimiento de la generación eólica, el objetivo del presente proyecto de fin de carrera es desarrollar un proyecto de diseño de un parque eólico en la zona de Qollpana, departamento de Cochabamba. La energía eléctrica generada en el parque eólico, debe ser capaz de inyectar la energía al Sistema Interconectado Nacional (SIN) de Bolivia. La potencia nominal del parque se determina en torno a 40 MW. La consecución de este objetivo principal engloba otros objetivos secundarios: • Clasificación de la zona de Qollpana para la instalación del parque eólico. • Elección de la tecnología de las turbinas eólicas. • Definición de las características de de infraestructura civil y eléctrica. • Integración de la generación eólica en la red eléctrica. • Análisis económico del proyecto a desarrollar.Ingeniería IndustrialIndustria Ingeniaritz

    Jarduera fisikoak linfoma duten pazienteetan daukan eragina

    Get PDF
    50 p. : il. -- Bibliogr.: p. 40-44Lan honekin, jarduera fisikoak linfoma daukaten pazienteetan duen eragina aztertu nahi da. Horretarako, lana bi zatitan banatu da. Lanaren hasieran oinarri teoriko bat azaldu da, minbizia ezagutu eta honek izan ditzakeen efektuak ikusteko. Ondoren, hainbat ikerketa ezberdin aztertu dira, programa ezberdinen arabera lortu diren emaitzak irakurri eta horren arabera programa bat sortzeko. Jarduera fisikoko programari dagokionez, 12 asteko programa bat proposatu da. Programa hau 18 urtetik gorako eta tratamendu aktiboan dauden pertsonei zuzendutakoa izango da. Programaren hasieran, erdialdean eta amaieran balorazio froga batzuk egingo zaizkie, pazienteen bilakaera ezagutu eta horren arabera entrenamendu saioak moldatzeko. Saioetan, gaitasun aerobikoa, indar ariketak, malgutasuna eta oreka landuko dira, helburuak lortzeko. Ondorio nagusi gisa, jarduera fisikoko programa batek minbizidun paziente guztien eskura egon beharko luke ospitale eta zentro guztietan. Ikertzeko asko badago ere, onura argiak sortzen ditu jarduera fisikoak pertsona guztiengan. Garrantzitsua da alderdi hauek ezagutaraztea, orokorrean eta ez minbizia daukaten pazienteengan soilik, gizarte aktibo eta osasuntsuago bat sustatzeko

    Multiorgan retrieval and preservation of the thoracic and abdominal organs in Maastricht III donors

    Get PDF
    This editorial describes the indications and technical aspects of the simultaneous retrieval of thoracic and abdominal organs in Maastricht III donors as well as the preservation of such organs until their implantation.©The Author(s) 202

    Augmented indoor hybrid maps using catadioptric vision

    Get PDF
    En este Trabajo de Fin de Máster se presenta un nuevo método para crear mapas semánticos a partir de secuencias de imágenes omnidireccionales. El objetivo es diseñar el nivel superior de un mapa jerárquico: mapa semántico o mapa topológico aumentado, aprovechando y adaptando este tipo de cámaras. La segmentación de la secuencia de imágenes se realiza distinguiendo entre Lugares y Transiciones, poniendo especial énfasis en la detección de estas Transiciones ya que aportan una información muy útil e importante al mapa. Dentro de los Lugares se hace una clasificación más detallada entre pasillos y habitaciones de distintos tipos. Y dentro de las Transiciones distinguiremos entre puertas, jambas, escaleras y ascensores, que son los principales tipos de Transiciones que aparecen en escenarios de interior. Para la segmentación del espacio en estos tipos de áreas se han utilizado solo descriptores de imagen globales, en concreto Gist. La gran ventaja de usar este tipo de descriptores es la mayor eficiencia y compacidad frente al uso de descriptores locales. Además para mantener la consistencia espacio-temporal de la secuencia de imágenes, se hace uso de un modelo probabilístico: Modelo Oculto de Markov (HMM). A pesar de la simplicidad del método, los resultados muestran cómo es capaz de realizar una segmentación de la secuencia de imágenes en clusters con significado para las personas. Todos los experimentos se han llevado a cabo utilizando nuestro nuevo data set de imágenes omnidireccionales, capturado con una cámara montada en un casco, por lo que la secuencia sigue el movimiento de una persona durante su desplazamiento dentro de un edificio. El data set se encuentra público en Internet para que pueda ser utilizado en otras investigaciones
    corecore