Détection de la parole et de la musique dans les documents sonores : fusion de deux approches

ANDRE-OBRECHT, Régine; MAUCLAIR, Julie; PINQUIER, Julien; ROUAS, Jean-Luc

unknown

Détection de la parole et de la musique dans les documents sonores : fusion de deux approches

Authors: Régine ANDRE-OBRECHT
Julie MAUCLAIR
Julien PINQUIER
Jean-Luc ROUAS
Publication date: 1 January 2003
Publisher: GRETSI, Groupe d’Etudes du Traitement du Signal et des Images

Abstract

Dans cet article, une segmentation de la bande sonore est effectuée en détectant les composantes parole et musique. Cette segmentation résulte de la fusion de deux approches de classification. La première, classique, est basée sur une analyse spectrale et des Modèles de Mélanges de Gaussiennes (MMG). La seconde, originale, utilise des paramètres "simples" et robustes: la modulation de l'énergie à quatre hertz, la modulation de l'entropie, la durée des segments (issus d'une segmentation automatique) et le nombre de ces segments par seconde. Notre système global se décompose en deux sous-systèmes de classification (Parole/NonParole et Musique/NonMusique). Il atteint respectivement 94 % d'accuracy pour la parole et 90 % pour la musique sachant qu'une décision est prise sur chaque seconde du signal. Il apparaît très intéressant d'améliorer un système classique, basé sur une analyse spectrale et des MMG, par des paramètres "simples" et robustes

Similar works

Full text

Open in the Core reader

Download PDF

Available Versions

I-Revues

oai:documents.irevues.inist.fr...

Last time updated on 03/09/2013