2 research outputs found

    A concurrent curve strategy for formant tracking

    Get PDF
    Colloque avec actes et comité de lecture. internationale.International audienceAlthough automatic formant tracking has a wide range of potential applications it is still an open problem. We previously proposed the use of active curves that deform under the influence of the spectrogram energy. Each formant was tracked independently and a complex strategy was required to guarantee the overall formant tracking consistency. This paper describes how the interdependency between formants can be incorporated directly during the deformations of formant tracks. Iterative processes attached to each formant are interlaced. We experimented two strategies. The first consists in partitioning the spectrogram into exclusive regions, each region affiliated to a given formant. The second consists in adding a repulsion force between formants that prevents formant tracks to merge together. It turns out that the second strategy is more robust and does not necessitate a complex control strategy

    Estimation de la longueur du conduit vocal pour l'inversion acoustique-articulatoire

    Get PDF
    National audienceLa géométrie complexe du conduit vocal rend le problème d'inversion acoustique-articulatoire difficile, notamment de par son caractère fortement mal-posé. La régularisation passe par l'ajout de contraintes, soit articulatoires (modèle articulatoire, nécessitant peu de paramètres, mais nécessitant d'être adapté à chaque locuteur), soit sur les valeurs des fonctions d'aires. Dans ce cas, la longueur du conduit vocal est généralement fixée à une certaine valeur arbitraire, ne permettant pas d'analyser des éventuelles protrusions ou des élongations/raccourcissements du pharynx. L'étude présentée ici propose une approche permettant d'estimer la longueur du conduit vocal de tout locuteur à partir de l'enregistrement du signal de parole. La méthode utilisée est une méthode analyse par synthèse consistant à retrouver la fonction d'aire générant les formants estimés du signal de parole du locuteur. Elle est effectuée à partir d'une fonction d'aire initiale que l'on modifie itérativement selon la méthode des fonctions de sensibilités, d'après la théorie développée par Fant et Pauli sur les perturbations de sections à l'intérieur du conduit vocal. Les travaux présent dans la littérature utilisant cette méthode imposent cependant une longueur fixe des fonctions d'aire, et par conséquent une longueur du conduit vocal fixe. Notre approche permet de régler ce problème en prenant en compte aussi les perturbations de longueur du conduit vocal. Une étude numérique et expérimentale permet de valider la technique dans le cas de voyelles orales du français
    corecore