19 research outputs found

    Codage audio à bas débit avec synthèse sinusoïdale

    Get PDF
    Les objectifs de notre recherche s’exposent en deux grands points : 1) Explorer les techniques de codage param étrique à synthèse sinusoïdale et les appliquer aux signaux audio (principalement de musique). 2) Améliorer la qualité intrinsèque de ces modèles notamment au niveau des compromis temps/fréquence propres au codage par transformées. Nous avons comme méthodologie, effectué des simulations en « C » et en MATLAB des récents algorithmes de synthèse sinusoïdale, mais en nous inspirant en particulier du codeur MSLPC (Multisinusoid LPC) de Wen- Whei C, De-Yu W. et Li-Wei W. de l’Université Nationale Chiao-Tung de Taiwan (5). Ce mémoire contient quatre chapitres. Le Chapitre 1 présente une introduction et une mise en contexte. Le chapitre 2 présente un aperçu sur le codage paramétrique et l’intérêt de cette technique. Une présentation des types de codeurs paramétriques existants suivra. Le chapitre 3 est consacré à la description des différentes étapes parcourues dans la conception d’un codeur à synthèse sinusoïdale avec des méthodes récemment développées. Le chapitre 4 présente la conception et l’implantation rigoureuse du modèle ainsi qu'une présentation de notre compromis temps/fréquence proposée pour améliorer la qualité intrinsèque du codeur sinusoïdal. Dans ce chapitre 4, nous présentons aussi une évaluation informelle de la performance de notre modèle. Enfin nous terminerons ce mémoire par une conclusion

    Encodage entropique des indices binaires d'un quantificateur algébrique encastré

    Get PDF
    Ce mémoire propose un algorithme de compression sans perte des indices binaires d'un quantificateur algébrique encastré utilisé par le codec AMR-WB+ pour encoder certaines des trames d'un signal audio. Une étude détaillée des statistiques a été menée dans le but de développer un algorithme efficace de compression et réduire par conséquent la longueur moyenne du code binaire utilisé par le codec AMR-WB+. En se basant sur cette étude des statistiques, deux techniques ont été combinées : l'encodage par plage et l'encodage par contexte qui se sont montrés très efficaces pour estimer les probabilités des différents indices. En utilisant l'encodage arithmétique en version entière pour générer le code binaire, l'algorithme proposé permet de réduire sans perte jusqu'à 10% de la longueur du code utilisé par le AMR-WB+ tout en respectant la contrainte d'une application temps réel destinée à des terminaux GSM

    Discrimination parole-musique pour le codage universel de l'audio

    Get PDF
    Le codage large bande de l'audio à bas débit est un enjeu majeur pour les télécommunications. Il est utilisé dans des applications de radio-diffusion sur Internet, de vidéo-conférence, de visio-téléphonie, et sera prochainement utilisé dans les futurs standards de téléphonie mobile. Il n'existe pas de modèles efficaces capables de coder à la fois les signaux de parole et de musique à bas débit, c'est à dire à moins de 1 bit/échantillon. Les codeurs de parole, basés sur la prédiction linéaire et la quantification vectorielle ont une mauvaise qualité pour la musique. Inversement, les codeurs de musique, basés sur un codage par transformée ou en sous-bande ont une mauvaise qualité pour les signaux de parole. Le but de cette maîtrise était de proposer une approche pragmatique pour le codage de l'audio à bas débit pour une application de radio-diffusion. Le système est basé sur une discrimination parole/musique, et un codage bi-modal, utilisant un codeur de musique, et un codeur de parole. Le système a été élaboré de façon à pouvoir utiliser différents modèles de codeurs. La discrimination parole/musique proposée dans ce mémoire s'appuie sur des techniques de reconnaissances de formes. Une analyse long-terme du signal est effectuée pour extraire 5 paramètres, basés sur les propriétés temporelles, fréquentielles et de stationnarité. Trois techniques de classification sont ensuite testées, les mélanges de gaussiennes, les K-plus proches voisins, et un perceptron multi-couches. Les performances de classification obtenues sont satisfaisantes, mais dépendent du délai que l'on se donne sur le signal. Pour éviter les artefacts qui apparaissent lors des transitions entre les codeurs si celles-ci surviennent dans des segments à haute énergie du signal, les transitions sont strictement limitées. Les performances obtenues sont alors meilleures que celles d'un codeur pris individuellement

    Codage large bande de la parole par encapsulation du codeur itu G-729 (CS-ACELP)

    Get PDF
    Les technologies modernes en codage numérique de la parole ont atteint un niveau de qualité qui permet de répondre à un grand nombre de besoins.Les communications téléphoniques en bande réduite peuvent ainsi être traitées sans difficulté avec un débit de 8 Kb/s (G.729). Le codage audio de haute qualité (CD) peut être compressé à des débits aussi faibles que 64 Kb/s. À un niveau intermédiaire, le codage large bande est satisfaisant pour un débit de 16 à 24 Kb/s. Le développement des applications multimédia sur l'Internet ainsi que les systèmes de conférence téléphonique feraient bon usage d'un système adaptatif permettant de régler le niveau de qualité du codage selon le débit disponible. Cette étude propose une solution destinée à répondre à ce besoin. Le projet qui va être décrit présente un système de codage encastré permettant d'offrir deux niveaux de qualité bande étroite/bande réduite pour les transmissions de parole. On utilise pour cela un codeur déjà normalisé, soit la norme G.729, que l'on cherche à encapsuler en un codeur large bande. Le débit du codeur de moins bonne qualité est celui du G.729. Pour la qualité supérieure, on reprend le débit de départ que l'on complète à 16 Kb/s à l'aide d'un second canal à 8 Kb/s

    Transmission efficace en temps réel de la voix sur réseaux ad hoc sans fil

    Get PDF
    La téléphonie mobile se démocratise et de nouveaux types de réseaux voient le jour, notamment les réseaux ad hoc. Sans focaliser exclusivement sur ces réseaux particuliers, le nombre de communications vocales effectuées chaque minute est en constante augmentation mais les réseaux sont encore souvent victimes d'erreurs de transmission. L'objectif de cette thèse porte sur l'utilisation de méthodes de codage en vue d'une transmission de la voix robuste face aux pertes de paquets, sur un réseau mobile et sans fil perturbé permettant le multichemin. La méthode envisagée prévoit l'utilisation d'un codage en descriptions multiples (MDC) appliqué à un flux de données issu d'un codec de parole bas débit, plus particulièrement l'AMR-WB (Adaptive Multi Rate - Wide Band). Parmi les paramètres encodés par l'AMR-WB, les coefficients de la prédiction linéaire sont calculés une fois par trame, contrairement aux autres paramètres qui sont calculés quatre fois. La problématique majeure réside dans la création adéquate de descriptions pour les paramètres de prédiction linéaire. La méthode retenue applique une quantification vectorielle conjuguée à quatre descriptions. Pour diminuer la complexité durant la recherche, le processus est épaulé d'un préclassificateur qui effectue une recherche localisée dans le dictionnaire complet selon la position d'un vecteur d'entrée. L'application du modèle de MDC à des signaux de parole montre que l'utilisation de quatre descriptions permet de meilleurs résultats lorsque le réseau est sujet à des pertes de paquets. Une optimisation de la communication entre le routage et le processus de création de descriptions mène à l'utilisation d'une méthode adaptative du codage en descriptions. Les travaux de cette thèse visaient la retranscription d'un signal de parole de qualité, avec une optimisation adéquate des ressources de stockage, de la complexité et des calculs. La méthode adaptative de MDC rencontre ces attentes et s'avère très robuste dans un contexte de perte de paquets

    Mise en forme du bruit de codage dans la norme G.722.1 ITU-T

    Get PDF
    Le projet décrit dans ce mémoire traite de la mise en forme du bruit de codage dans la norme G.722.1 ITU-T. Cette étude a deux volets: d'une part, il s'agit d'incorporer trois techniques de mise en forme du bruit dans la norme G.722.1, à savoir, le gauchissement fréquentiel (frequency warping ), le fenêtrage adaptatif ( windows switching ), et la mise en forme temporelle du bruit ( temporal noise shaping ), dans le but d'étudier l'effet de chaque modification sur la qualité de codage à 16 kbit/s des signaux échantillonnés à 16 kHz. L'autre volet du projet a pour objet la substitution de la quantification scalaire et du codage Huffman par une quantification vectorielle algébrique. Une quantification sphérique se basant sur un réseau de Gosset à 8 dimensions, E[indice inférieur 8] , sera utilisée à cet effet pour quantifier les coefficients du spectre générés dans la norme G.722.1. Cette application va tenter de réaliser un codage des signaux audio large bande (50 Hz-7 kHz) à un taux binaire de 16 kbit/s

    La conception d'un quantificateur vectoriel robuste aux erreurs du canal

    Get PDF
    Nous vivons dans l'ère des télécommunications. Les radio-mobiles, le multimédia et les communications globales font déjà partie de notre langage quotidien. La société devient de plus en plus complexe et les besoins de stockage et de communication s'accroissent rapidement. La course à la compression des données est motivée par la théorie du codage de source de Shannon. Lorsque l'information de source est comprimée et codée de façon très efficace, et qu'elle est transmise sur un canal bruité, les performances prévues par le système de codage de source sont très rapidement dégradées. C'est Shannon lui-même qui vient au secours, dans ce cas, en assurant l'existence de schémas de codage de canal capables d'atteindre le modèle de 'canal sans bruit'. Ce résultat fondamental de la théorie de l'information a permis de traiter le problème de codages de source et de canal de façon complètement séparée, sans aucune perte d'optimalité par rapport à un système globalement optimal. Le travail réalisé au cours de ce projet est motivé par l'augmentation des besoins en codage bas-débit des systèmes basés sur la quantification vectorielle et utilisant des canaux bruités, comme les communications radio-mobiles de la parole. Dans ce mémoire de maîtrise, on présente ainsi les techniques visant à combattre efficacement la dégradation de la performance causée par les canaux bruités

    Quantification vectorielle algébrique et codage de parole en bande élargie

    Get PDF
    L'objet de cette thèse est l'étude de la quantification vectorielle algébrique et de son application au codage du signal de parole. La quantification vectorielle algébrique, appelée aussi la quantification vectorielle par réseaux réguliers, est considérée comme une technique de quantification pleine de promesses. À cause de la nature fortement structurée des réseaux réguliers, cette technique permet de réduire la complexité (en stockage et en calcul) de la quantification vectorielle. Plusieurs approches efficaces et pratiques de la quantification vectorielle algébrique sont proposées dans cette étude. Le quantificateur vectoriel ellipsoïdal permet de quantifier efficacement les coefficients de transformation distribués en forme d'ellipsoïde dans le codage par transformée. Les quantificateurs vectoriels triangulaires et pyramidaux sont utilisés pour quantifier les paramètres LSF du signal de parole. Et les quantificateurs vectoriels encastrés sont appliqués au codage de la parole en bande élargie (50-7000 Hz)

    L'hexacode, le code de Golay et le réseau de Leech construction, décodage, application en quantification

    Get PDF
    Ce mémoire traite spécifiquement de l'utilisation du code quaternaire [6,3,4], l' hexacode , en quantification vectorielle. Celui-ci permet de construire et surtout de décoder très efficacement le code de Golay binaire étendu [24,12,8] et le réseau de Leech tourné R ? 24 . Ces objets sont exceptionnels; ils servent tout particulièrement de base de comparaison dans l'étude des algorithmes de décodage algébrique. Le sujet est inspiré de travaux de recherche sur le codage de canal et la modulation codée, mais les résultats sont appliqués ici à la quantification uniquement. Les algorithmes proposés dans la littérature (à distance minimale et à distance bornée) sont détaillés; de nouveaux al gorithmes, fondés sur une recherche en profondeur d'abord, sont proposés. Les algorithmes de décodage algébrique sont appliqués à la quantification d'une source gaussienne sans mémoire . En effet, de par la dualité source-canal, ce qui est décodage au sens du canal peut servir au codage au sens de la source. Il ressort qu'en 24 dimensions le décodage algébrique sous-optimal offre un meilleur compromis entre performance et complexité que le décodage algébrique à distance minimale. Ce résultat incite donc à explorer les dimensions élévées de quantification au moyen de techniques algébriques et d'algorithmes de décodage sous-optimaux

    Conception et développement d'un analyseur de parole multialgorithmes pour implant cochléaire

    Get PDF
    Cette thèse décrit la conception et le développement de la partie externe d'une prothèse cochléaire. Le système comprend un microphone qui capte le son, un analyseur de son autonome, un modulateur qui communique les sorties de ce dernier à la partie implantée, une partie logicielle développée sur un ordinateur PC compatible destiné à l'usage clinique pour programmer et ajuster l'appareil et une carte de communication qui interface la partie logicielle à la partie matérielle. L'originalité du système vient du fait qu'il possède une structure complètement numérique qui lui confère une programmabilité quasi-illimitée, une flexibilité sans précédent et une transparence complète aux algorithmes de stimulation. En plus de permettre la mise en oeuvre d'algorithmes aussi complexes soient-ils, il est conçu pour offrir plusieurs algorithmes simultanément et ainsi le patient pourra sélectionner à sa convenance l'algorithme qu'il préfère selon les circonstances, à l'aide d'un simple bouton de mis à sa disposition. Cette thèse commence par une introduction sur la problématique du sujet. Le deuxième chapitre s'attarde sur les caractéristiques de la parole et son lien avec l'oreille. On y explique la physiologie de l'oreille et on y fait un lien avec les stimulations électriques de la cochlée. Par la suite, on présente un survol des implants, analyseurs et algorithmes existants sur la scène scientifique. Ceci jette une première base quant à la conception de l'analyseur et démontre que l'implant, l'analyseur et les algorithmes doivent être indépendants. Le troisième chapitre traite de l'aspect algorithme de l'analyseur. Il présente en premier lieu les considérations à prendre en compte lors des stimulations électriques. Ceci nous permettra de mieux comprendre les algorithmes de stimulation. La seconde partie du chapitre, présente les méthodes de traitement de signaux numériques et de traitement de parole qui peuvent servir dans le développement des algorithmes en permettant d'extraire l'information pertinente de la parole. Dans cette partie on fera ressortir la distinction entre l'algorithme de stimulation, l'algorithme de traitement de son ou parole et la stratégie de stimulation. Le quatrième chapitre concerne la conception de l'analyseur proprement dite. À partir des données recueillies et des concepts décrits dans les chapitres précédents les critères de base de la conception du nouvel analyseur seront établis".--Résumé abrégé par UMI
    corecore