Search CORE

2 research outputs found

Weak label supervision for monaural source separation using non-negative denoising variational autoencoders

Author: Cemgil Ali Taylan
Karamatlı Ertuğ
Kırbız Serap
Publication venue: 'Institute of Electrical and Electronics Engineers (IEEE)'
Publication date: 01/01/2019
Field of study

Derin öğrenme modelleri, büyük miktarda etiketlenmiş veri bulunduğunda kaynak ayrıştırmada çok başarılı olmaktadır. Bununla birlikte, dikkatlice etiketlenmiş veri kümelerine erişim her zaman mümkün olmamaktadır. Bu bildiride, kısa konuşma karışımlarını ayrıştırmayı öğrenmek için kaynak işaretlerini değil de sadece sınıf bilgisini kullanan zayıf bir denetim önerilmektedir. Negatif olmayan bir modeldeki her bir sınıfla degişimsel bir otomatik kodlayıcıyı (VAE) ilişkilendirilmektedir. Derin evrisimsel VAE’lerin, herhangi bir kaynak sinyaline ihtiyaç duymadan, bir ses karı¸sımındaki karmasık isaretleri kestirmek için önsel bir model sundugu gösterilmektedir. Ayrıstırma sonuçlarının kaynak isaret denetimiyle esit düzeyde oldugu gösterilmektedir.Deep learning models are very effective in source separation when there are large amounts of labeled data available. However it is not always possible to have carefully labeled datasets. In this paper, we propose a weak supervision method that only uses class information rather than source signals for learning to separate short utterance mixtures. We associate a variational autoencoder (VAE) with each class within a nonnegative model. We demonstrate that deep convolutional VAEs provide a prior model to identify complex signals in a sound mixture without having access to any source signal. We show that the separation results are on par with source signal supervisionWOS:000518994300189Scopus - Affiliation ID: 60105072Conference Proceedings Citation Index- ScienceArticleNisan2019YÖK - 2018-1

Crossref

MEF University Institutional Repository