Search CORE

6 research outputs found

A general modular framework for audio source separation

Author: Bimbot Frédéric
Ozerov Alexey
Vincent Emmanuel
Publication venue: HAL CCSD
Publication date: 27/09/2010
Field of study

International audienceMost of audio source separation methods are developed for a particular scenario characterized by the number of sources and channels and the characteristics of the sources and the mixing process. In this paper we introduce a general modular audio source separation framework based on a library of flexible source models that enable the incorporation of prior knowledge about the characteristics of each source. First, this framework generalizes several existing audio source separation methods, while bringing a common formulation for them. Second, it allows to imagine and implement new efficient methods that were not yet reported in the literature. We first introduce the framework by describing the flexible model, explaining its generality, and summarizing our modular implementation using a Generalized Expectation-Maximization algorithm. Finally, we illustrate the above-mentioned capabilities of the framework by applying it in several new and existing configurations to different source separation scenarios

HAL-CentraleSupelec

INRIA a CCSD electronic archive server

Hal-Diderot

HAL-Rennes 1

Drum extraction from polyphonic music based on a spectro-temporal model of percussive sounds

Author: Lagrange Mathieu
Peeters Geoffroy
Rigaud François
Roebel Axel
Publication venue: 'Institute of Electrical and Electronics Engineers (IEEE)'
Publication date: 01/01/2011
Field of study

cote interne IRCAM: Rigaud11aNone / NoneNational audienceDrum Extraction From Polyphonic Music Based on a Spectro-Temporal Model of Percussive Sound

Crossref

HAL Descartes

On the use of a spatial cue as prior information for stereo sound source separation based on spatially weighted non-negative tensor factorization

Author: A Cichocki
A Ozerov
A Ozerov
A Ozerov
A Ozerov
A Shashua
C Févotte
C Févotte
C Févotte
D FitzGerald
DD Lee
E Vincent
E Vincent
F Weninger
H Sawada
JM Becker
M Cranitch
M Nakano
M Spiertz
N Bertin
NQ Duong
NQK Duong
O Dikmen
P Smaragdis
R Jaiswal
S Araki
S Arberet
S Doclo
S Ewert
TJ Klasen
TO Virtanen
Y Mitsufuji
Ö Yilmaz
Publication venue: 'Springer Science and Business Media LLC'
Publication date
Field of study

Crossref

A tractable framework for estimating and combining spectral source models for audio source separation

Author: Alexey Ozerov
Arberet
Attias
Belouchrani
Benaroya
Berger
Bishop
Bofill
Campbell
Davies
Deng
Frédéric Bimbot
Févotte
Ghahramani
Jaakkola
O'Grady
Ozerov
Ozerov
Parra
Picinbono
Puigt
Pulkki
Rémi Gribonval
Simon Arberet
Vincent
Yılmaz
Zibulevsky
Publication venue: 'Elsevier BV'
Publication date
Field of study

Crossref

Audio source separation for music in low-latency and high-latency scenarios

Author: Marxer Piñón Ricard
Publication venue: 'Universitat Pompeu Fabra'
Publication date: 01/01/2013
Field of study

Aquesta tesi proposa mètodes per tractar les limitacions de les tècniques existents de separació de fonts musicals en condicions de baixa i alta latència. En primer lloc, ens centrem en els mètodes amb un baix cost computacional i baixa latència. Proposem l'ús de la regularització de Tikhonov com a mètode de descomposició de l'espectre en el context de baixa latència. El comparem amb les tècniques existents en tasques d'estimació i seguiment dels tons, que són passos crucials en molts mètodes de separació. A continuació utilitzem i avaluem el mètode de descomposició de l'espectre en tasques de separació de veu cantada, baix i percussió. En segon lloc, proposem diversos mètodes d'alta latència que milloren la separació de la veu cantada, gràcies al modelatge de components específics, com la respiració i les consonants. Finalment, explorem l'ús de correlacions temporals i anotacions manuals per millorar la separació dels instruments de percussió i dels senyals musicals polifònics complexes.Esta tesis propone métodos para tratar las limitaciones de las técnicas existentes de separación de fuentes musicales en condiciones de baja y alta latencia. En primer lugar, nos centramos en los métodos con un bajo coste computacional y baja latencia. Proponemos el uso de la regularización de Tikhonov como método de descomposición del espectro en el contexto de baja latencia. Lo comparamos con las técnicas existentes en tareas de estimación y seguimiento de los tonos, que son pasos cruciales en muchos métodos de separación. A continuación utilizamos y evaluamos el método de descomposición del espectro en tareas de separación de voz cantada, bajo y percusión. En segundo lugar, proponemos varios métodos de alta latencia que mejoran la separación de la voz cantada, gracias al modelado de componentes que a menudo no se toman en cuenta, como la respiración y las consonantes. Finalmente, exploramos el uso de correlaciones temporales y anotaciones manuales para mejorar la separación de los instrumentos de percusión y señales musicales polifónicas complejas.This thesis proposes specific methods to address the limitations of current music source separation methods in low-latency and high-latency scenarios. First, we focus on methods with low computational cost and low latency. We propose the use of Tikhonov regularization as a method for spectrum decomposition in the low-latency context. We compare it to existing techniques in pitch estimation and tracking tasks, crucial steps in many separation methods. We then use the proposed spectrum decomposition method in low-latency separation tasks targeting singing voice, bass and drums. Second, we propose several high-latency methods that improve the separation of singing voice by modeling components that are often not accounted for, such as breathiness and consonants. Finally, we explore using temporal correlations and human annotations to enhance the separation of drums and complex polyphonic music signals

LAReferencia - Red Federada de Repositorios Institucionales de Publicaciones Científicas Latinoamericanas

Tesis Doctorals en Xarxa