Search CORE

119 research outputs found

Bi-class classification of humpback whale sound units against complex background noise with Deep Convolution Neural Network

Author: Adam Olivier
Bonnel Julien
Dorian Cazau
Lefort Riwal
Zarader Jean-Luc
Publication venue
Publication date: 01/01/2017
Field of study

Automatically detecting sound units of humpback whales in complex time-varying background noises is a current challenge for scientists. In this paper, we explore the applicability of Convolution Neural Network (CNN) method for this task. In the evaluation stage, we present 6 bi-class classification experimentations of whale sound detection against different background noise types (e.g., rain, wind). In comparison to classical FFT-based representation like spectrograms, we showed that the use of image-based pretrained CNN features brought higher performance to classify whale sounds and background noise.Comment: arXiv admin note: text overlap with arXiv:1702.02741 by other author

arXiv.org e-Print Archive

HAL-Université de Bretagne Occidentale

Combinaison de codeurs par algorithme génétique : Application à la vérification du locuteur

Author: CHARBUILLET C.
CHETOUANI M.
GAS B.
ZARADER J. L.
Publication venue: GRETSI, Groupe d’Etudes du Traitement du Signal et des Images
Publication date: 01/01/2007
Field of study

Le domaine de la vérification du locuteur regroupe les applications pour lesquelles on désire identifier l'identité d'une personne à partir de sa voix. Le champ d'application couvre de nombreux secteurs tels que l'accès sécurisé, les transactions téléphoniques, la surveillance, l'indexation audio ou encore l'expertise judiciaire. Notre étude porte sur l'étape d'extraction de caractéristiques du système de reconnaissance du locuteur. Ce module a pour fonction d'extraire du signal de parole les informations pertinentes du point de vue de la discrimination inter-locuteur. Nous proposons dans cet article d'utiliser un algorithme génétique pour optimiser un système d'extraction de caractéristiques adapté à la reconnaissance du locuteur. La méthode proposée permet d'obtenir une amélioration significative du taux de reconnaissance sur la base Nist SRE 2005

I-Revues

New approach of complex demodulation zoom: frequency filtering zoom

Author: GARNIER (M.)
NICOLLET (M.)
ZARADER (J.-L.)
Publication venue: GRETSI, Saint Martin d'Hères, France
Publication date: 01/01/1990
Field of study

The spectral component discrimination or the estimation of one or more signal frequencies are classical problems in signal processing. In this paper, we study a nerv technic to increase the frequency resolution called frequency filtering zoom (LFF) . This method is complementary of existing methods since it allows to save the spectrum amplitude and phase of the signal . On the other hand, a software real time analysis of signal is possible by this zoom .La séparation de composantes spectrales proches ou l'évaluation précise d'une ou plusieurs fréquences d'un signal sont des problèmes classiques en traitement du signal . Nous présentons dans cet article une nouvelle technique d'accroissement de la résolution fréquentielle appelée loupe par filtrage fréquentiel (LFF) . Cette méthode présente J'avantage, par rapport aux zoom existants, de restituer les spectres d'amplitude et de phase du signal traité . D'autre part cette loupe a été conçue de façon à permettre, par logiciel, un traitement en temps réel de signaux basse fréquence

I-Revues

Une architecture modulaire pour l'extraction de caractéristiques en reconnaissance de phonèmes

Author: CAS B.
CHETOUANI M.
ZARADER J. L.
Publication venue: GRETSI, Groupe d’Etudes du Traitement du Signal et des Images
Publication date: 01/01/2003
Field of study

- Dans ce papier, nous présentons une architecture appelée Modular Neural Prédictive Coding (MNPC). Elle est utilisée pour l'extraction de caractéristiques discriminantes. Cette architecture est conçue à l'aide de connaissances phonétiques. On estime les performances de cette architecture sur une tâche de reconnaissance de phonèmes extraits de la base Darpa-Timit. Une comparaison avec les méthodes de codage (LPC, MFCC et PLP) montrent une nette amélioration du taux de reconnaissance

I-Revues

Codage discriminant appliqué à la reconnaissance de phonèmes

Author: CHAVY Cyril
GAS Bruno
ZARADER Jean-Luc
Publication venue: GRETSI, Groupe d’Etudes du Traitement du Signal et des Images
Publication date: 01/01/1999
Field of study

Nous proposons dans cet article une nouvelle méthode de codage appliquée à la reconnaissance de phonèmes. Le modèle en question est une extension au domaine non linéaire des méthodes de codage adaptatives habituellement utilisées en reconnaissance de la parole. Il est basé sur l'utilisation d'un réseau de neurones perceptron multicouches en prédiction. Nous montrons qu'il est possible d'introduire des informations de classe d'appartenance des signaux dès l'étape de codage, ce qui permet d'améliorer significativement les résultats en reconnaissance. Afin d'évaluer les performances du codeur NPC (Codeur Prédictif Neuronal), nous présentons une étude expérimentale à partir de phonèmes issus de la base Darpa-Ntimit. Les simulations présentées mettent en évidence une amélioration des taux de classification relativement aux codages classiques

I-Revues