23 research outputs found

    PENGKODEAN SUARA PITA LEBAR

    Get PDF
    Makalah ini menampilkan studi literatur tentang pengkode suara pita lebar yang ditujukan untuk aplikasi pada sistem komunikasi bergerak generasi ke-tiga (3G). Teknologi 3G telah memberi peluang penggunaan suara pita lebar (frekuensi 50-7000 Hz) untuk meningkatkan kualitas komunikasi suara. Suara pita lebar telah terbukti mampu membuat suara terdengar lebih alami (naturalness), memudahkan pendengar membedakan fricative sounds, dan mengurangi tingkat kelelahan dalam berkomunikasi (listener fatigue). Perkembangan penelitian tentang metode pengkodean dan metode kuantisasi vektor terhadap LPC parameter pada pengkode suara pita lebar disampaikan beserta algoritma yang digunakan untuk perancangan quantiser vektor

    A turbo-coded burst-by-burst adaptive wide-band speech transceiver

    Full text link

    Étude comparative de filtres perceptuels adaptés à des codeurs audio

    Get PDF
    Les codeurs audio de haute qualité utilisent souvent un modèle psychoacoustique pour prendre en compte les propriétés de l'oreille. On compare des filtres perceptuels, calculés à partir d'une prédiction linéaire, avec des filtres obtenus avec des seuils de masquage utilisés dans des codeurs de musique. Nous avons remarqué que ces derniers ne donnent pas de meilleurs résultats. Si la démarche la plus naturelle consiste à définir un meilleur modèle psychoacoustique, on propose ici une méthode intermédiaire consistant à donner plus de degrés de liberté à une méthode de type standard, en traitant individuellement les zéros du filtre blanchissant

    Codificación de voz mediante coeficientes de prediccion lineal (lpc) sobre Microblaze

    Get PDF
    En este trabajo se presenta el diseño de un codec de audio para telefonía VoIP implementado sobre un microprocesador MicroBlaze empotrado sobre un circuito FPGA de la familia Spartan 3E. Se describe primeramente el diseño del microprocesador y de los periféricos a emplear, entre los cuales se destaca el manejo de una memoria externa DDR y de una interfaz serie RS232 que permite comunicar el sistema con una computadora PC. En el trabajo se implementa una variante del algoritmo LPC10 con velocidad de 2.4 Kb/s y los algoritmos se implementan en el procesador en lenguaje C. La evaluación del sistema se realiza a partir del análisis de los datos enviados hacia la PC que son analizados con el procesador Matlab y comparados con resultados simulados. Este trabajo tributa a una tarea del proyecto “Plataforma de Conmutación de Paquetes”, aprobado por el MIC al ISPJAE con participación de la UPR y GK

    Frequency-warped autoregressive modeling and filtering

    Get PDF
    This thesis consists of an introduction and nine articles. The articles are related to the application of frequency-warping techniques to audio signal processing, and in particular, predictive coding of wideband audio signals. The introduction reviews the literature and summarizes the results of the articles. Frequency-warping, or simply warping techniques are based on a modification of a conventional signal processing system so that the inherent frequency representation in the system is changed. It is demonstrated that this may be done for basically all traditional signal processing algorithms. In audio applications it is beneficial to modify the system so that the new frequency representation is close to that of human hearing. One of the articles is a tutorial paper on the use of warping techniques in audio applications. Majority of the articles studies warped linear prediction, WLP, and its use in wideband audio coding. It is proposed that warped linear prediction would be particularly attractive method for low-delay wideband audio coding. Warping techniques are also applied to various modifications of classical linear predictive coding techniques. This was made possible partly by the introduction of a class of new implementation techniques for recursive filters in one of the articles. The proposed implementation algorithm for recursive filters having delay-free loops is a generic technique. This inspired to write an article which introduces a generalized warped linear predictive coding scheme. One example of the generalized approach is a linear predictive algorithm using almost logarithmic frequency representation.reviewe

    Format-Independent Rich Media Delivery Using the Bitstream Binding Language

    Full text link

    Nouvelles techniques de quantification vectorielle algébrique basées sur le codage de Voronoi : application au codage AMR-WB+

    Get PDF
    L'objet de cette thèse est l'étude de la quantification (vectorielle) par réseau de points et de son application au modèle de codage audio ACELP/TCX multi-mode. Le modèle ACELP/TCX constitue une solution possible au problème du codage audio universel---par codage universel, on entend la représentation unifiée de bonne qualité des signaux de parole et de musique à différents débits et fréquences d'échantillonnage. On considère ici comme applications la quantification des coefficients de prédiction linéaire et surtout le codage par transformée au sein du modèle TCX; l'application au codage TCX a un fort intérêt pratique, car le modèle TCX conditionne en grande partie le caractère universel du codage ACELP/TCX. La quantification par réseau de points est une technique de quantification par contrainte, exploitant la structure linéaire des réseaux réguliers. Elle a toujours été considérée, par rapport à la quantification vectorielle non structurée, comme une technique prometteuse du fait de sa complexité réduite (en stockage et quantité de calculs). On montre ici qu'elle possède d'autres avantages importants: elle rend possible la construction de codes efficaces en dimension relativement élevée et à débit arbitrairement élevé, adaptés au codage multi-débit (par transformée ou autre); en outre, elle permet de ramener la distorsion à la seule erreur granulaire au prix d'un codage à débit variable. Plusieurs techniques de quantification par réseau de points sont présentées dans cette thèse. Elles sont toutes élaborées à partir du codage de Voronoï. Le codage de Voronoï quasi-ellipsoïdal est adapté au codage d'une source gaussienne vectorielle dans le contexte du codage paramétrique de coefficients de prédiction linéaire à l'aide d'un modèle de mélange gaussien. La quantification vectorielle multi-débit par extension de Voronoï ou par codage de Voronoï à troncature adaptative est adaptée au codage audio par transformée multi-débit. L'application de la quantification vectorielle multi-débit au codage TCX est plus particulièrement étudiée. Une nouvelle technique de codage algébrique de la cible TCX est ainsi conçue à partir du principe d'allocation des bits par remplissage inverse des eaux

    Quantification vectorielle algébrique et codage de parole en bande élargie

    Get PDF
    L'objet de cette thèse est l'étude de la quantification vectorielle algébrique et de son application au codage du signal de parole. La quantification vectorielle algébrique, appelée aussi la quantification vectorielle par réseaux réguliers, est considérée comme une technique de quantification pleine de promesses. À cause de la nature fortement structurée des réseaux réguliers, cette technique permet de réduire la complexité (en stockage et en calcul) de la quantification vectorielle. Plusieurs approches efficaces et pratiques de la quantification vectorielle algébrique sont proposées dans cette étude. Le quantificateur vectoriel ellipsoïdal permet de quantifier efficacement les coefficients de transformation distribués en forme d'ellipsoïde dans le codage par transformée. Les quantificateurs vectoriels triangulaires et pyramidaux sont utilisés pour quantifier les paramètres LSF du signal de parole. Et les quantificateurs vectoriels encastrés sont appliqués au codage de la parole en bande élargie (50-7000 Hz)

    Mise en forme du bruit de codage dans la norme G.722.1 ITU-T

    Get PDF
    Le projet décrit dans ce mémoire traite de la mise en forme du bruit de codage dans la norme G.722.1 ITU-T. Cette étude a deux volets: d'une part, il s'agit d'incorporer trois techniques de mise en forme du bruit dans la norme G.722.1, à savoir, le gauchissement fréquentiel (frequency warping ), le fenêtrage adaptatif ( windows switching ), et la mise en forme temporelle du bruit ( temporal noise shaping ), dans le but d'étudier l'effet de chaque modification sur la qualité de codage à 16 kbit/s des signaux échantillonnés à 16 kHz. L'autre volet du projet a pour objet la substitution de la quantification scalaire et du codage Huffman par une quantification vectorielle algébrique. Une quantification sphérique se basant sur un réseau de Gosset à 8 dimensions, E[indice inférieur 8] , sera utilisée à cet effet pour quantifier les coefficients du spectre générés dans la norme G.722.1. Cette application va tenter de réaliser un codage des signaux audio large bande (50 Hz-7 kHz) à un taux binaire de 16 kbit/s
    corecore