119 research outputs found

    Bi-class classification of humpback whale sound units against complex background noise with Deep Convolution Neural Network

    Full text link
    Automatically detecting sound units of humpback whales in complex time-varying background noises is a current challenge for scientists. In this paper, we explore the applicability of Convolution Neural Network (CNN) method for this task. In the evaluation stage, we present 6 bi-class classification experimentations of whale sound detection against different background noise types (e.g., rain, wind). In comparison to classical FFT-based representation like spectrograms, we showed that the use of image-based pretrained CNN features brought higher performance to classify whale sounds and background noise.Comment: arXiv admin note: text overlap with arXiv:1702.02741 by other author

    Combinaison de codeurs par algorithme génétique : Application à la vérification du locuteur

    Get PDF
    Le domaine de la vérification du locuteur regroupe les applications pour lesquelles on désire identifier l'identité d'une personne à partir de sa voix. Le champ d'application couvre de nombreux secteurs tels que l'accès sécurisé, les transactions téléphoniques, la surveillance, l'indexation audio ou encore l'expertise judiciaire. Notre étude porte sur l'étape d'extraction de caractéristiques du système de reconnaissance du locuteur. Ce module a pour fonction d'extraire du signal de parole les informations pertinentes du point de vue de la discrimination inter-locuteur. Nous proposons dans cet article d'utiliser un algorithme génétique pour optimiser un système d'extraction de caractéristiques adapté à la reconnaissance du locuteur. La méthode proposée permet d'obtenir une amélioration significative du taux de reconnaissance sur la base Nist SRE 2005

    New approach of complex demodulation zoom: frequency filtering zoom

    Get PDF
    The spectral component discrimination or the estimation of one or more signal frequencies are classical problems in signal processing. In this paper, we study a nerv technic to increase the frequency resolution called frequency filtering zoom (LFF) . This method is complementary of existing methods since it allows to save the spectrum amplitude and phase of the signal . On the other hand, a software real time analysis of signal is possible by this zoom .La séparation de composantes spectrales proches ou l'évaluation précise d'une ou plusieurs fréquences d'un signal sont des problèmes classiques en traitement du signal . Nous présentons dans cet article une nouvelle technique d'accroissement de la résolution fréquentielle appelée loupe par filtrage fréquentiel (LFF) . Cette méthode présente J'avantage, par rapport aux zoom existants, de restituer les spectres d'amplitude et de phase du signal traité . D'autre part cette loupe a été conçue de façon à permettre, par logiciel, un traitement en temps réel de signaux basse fréquence

    Une architecture modulaire pour l'extraction de caractéristiques en reconnaissance de phonèmes

    Get PDF
    - Dans ce papier, nous présentons une architecture appelée Modular Neural Prédictive Coding (MNPC). Elle est utilisée pour l'extraction de caractéristiques discriminantes. Cette architecture est conçue à l'aide de connaissances phonétiques. On estime les performances de cette architecture sur une tâche de reconnaissance de phonèmes extraits de la base Darpa-Timit. Une comparaison avec les méthodes de codage (LPC, MFCC et PLP) montrent une nette amélioration du taux de reconnaissance

    Codage discriminant appliqué à la reconnaissance de phonèmes

    Get PDF
    Nous proposons dans cet article une nouvelle méthode de codage appliquée à la reconnaissance de phonèmes. Le modèle en question est une extension au domaine non linéaire des méthodes de codage adaptatives habituellement utilisées en reconnaissance de la parole. Il est basé sur l'utilisation d'un réseau de neurones perceptron multicouches en prédiction. Nous montrons qu'il est possible d'introduire des informations de classe d'appartenance des signaux dès l'étape de codage, ce qui permet d'améliorer significativement les résultats en reconnaissance. Afin d'évaluer les performances du codeur NPC (Codeur Prédictif Neuronal), nous présentons une étude expérimentale à partir de phonèmes issus de la base Darpa-Ntimit. Les simulations présentées mettent en évidence une amélioration des taux de classification relativement aux codages classiques

    Foi et pensée chez Heidegger

    No full text
    National audienc

    Herméneutique et restitution

    No full text
    International audienc
    • …
    corecore