5,344 research outputs found
A Statistically Principled and Computationally Efficient Approach to Speech Enhancement using Variational Autoencoders
Recent studies have explored the use of deep generative models of speech
spectra based of variational autoencoders (VAEs), combined with unsupervised
noise models, to perform speech enhancement. These studies developed iterative
algorithms involving either Gibbs sampling or gradient descent at each step,
making them computationally expensive. This paper proposes a variational
inference method to iteratively estimate the power spectrogram of the clean
speech. Our main contribution is the analytical derivation of the variational
steps in which the en-coder of the pre-learned VAE can be used to estimate the
varia-tional approximation of the true posterior distribution, using the very
same assumption made to train VAEs. Experiments show that the proposed method
produces results on par with the afore-mentioned iterative methods using
sampling, while decreasing the computational cost by a factor 36 to reach a
given performance .Comment: Submitted to INTERSPEECH 201
Góngora y la poesÃa culterana
Las Soledades, cima del movimiento culterano fueron definidas por Lope de Vega con palabras contundentes: "colores y ruido". La precisión del poeta madrileño debe de entenderse referida a muchos de los continuadores de Góngora que colocaron en primer término la rebuscada imaginerÃa barroca y el alarde erudito, pensando "llegar a su ingenio por imitar su estilo". Es, también, frase de Lope
LibriMix: An Open-Source Dataset for Generalizable Speech Separation
In recent years, wsj0-2mix has become the reference dataset for
single-channel speech separation. Most deep learning-based speech separation
models today are benchmarked on it. However, recent studies have shown
important performance drops when models trained on wsj0-2mix are evaluated on
other, similar datasets. To address this generalization issue, we created
LibriMix, an open-source alternative to wsj0-2mix, and to its noisy extension,
WHAM!. Based on LibriSpeech, LibriMix consists of two- or three-speaker
mixtures combined with ambient noise samples from WHAM!. Using Conv-TasNet, we
achieve competitive performance on all LibriMix versions. In order to fairly
evaluate across datasets, we introduce a third test set based on VCTK for
speech and WHAM! for noise. Our experiments show that the generalization error
is smaller for models trained with LibriMix than with WHAM!, in both clean and
noisy conditions. Aiming towards evaluation in more realistic,
conversation-like scenarios, we also release a sparsely overlapping version of
LibriMix's test set.Comment: submitted to INTERSPEECH 202
Quelle place pour la philosophie en général, la philosophie pratique en particulier dans la Cité ?
On tente de reposer la place de la philosophie pratique dans la Cité, en admettant, dans une conception internaliste de la motivation, qu'il ne s'agit pas, pour les philosophes, d'imposer une énième version d'une théorie éthique. Dès lors, dans cette recherche, l'idée d'un usage du dialogue socratique pourra prendre tout son sens
Méta-éthique et métaphysique : une tentative pour éclairer le préfixe " méta " par des analogies insulaires
On tentera d'éclairer par des analogies insulaires les liens entre méta-éthique, méta-esthétique et méta-physique de manière à éclairer le sens du préfixe méta
Estudio descriptivo de la adquisición de Ãtems del desarrollo psicomotor en lactantes desde Atención Primaria
La valoración del desarrollo psicomotor es una actividad obligada en la evaluación del niño sano y de niños con determinadas patologÃas y es un proceso complejo que precisa un seguimiento a lo largo del tiempo, que debe realizarse en función de la edad del niño y su edad gestacional. Por ello, los controles de salud en atención primaria son importantes, puesto que suponen el momento idóneo para dicha evaluación.
El estudio de la adquisición de los Ãtems del desarrollo en determinadas poblaciones, da cierta información sobre los márgenes de edad en los que la mayorÃa de la población lo consigue, de forma que, cuanto más lejos se sitúe la adquisición de una nueva habilidad, hay más probabilidad de que haya una alteración. Por esto es importante conocer a qué edades se alcanzan los Ãtems del desarrollo y sus márgenes de seguridad.Grado en Medicin
- …