Search CORE

4 research outputs found

Incrustation d'un logo dans un ficher vidéo codé avec le standard MPEG-2

Author: Keroulas Patrick
Publication venue: 'Universite de Sherbrooke'
Publication date: 01/01/2009
Field of study

Ce mémoire constitue l'aboutissement du projet de recherche de Patrick Keroulas et aborde la notion de compression vidéo, domaine en pleine ébullition avec la démocratisation de l'équipement vidéo et des réseaux de télécommunication. La question initiale est de savoir s'il est possible de modifier le contenu de l'image directement dans un flux binaire provenant d'une séquence vidéo compressée. Un tel dispositif permettrait d'ajouter des modifications en n'importe quel point d'un réseau en évitant le décodage et recodage du flux de données, ces deux processus étant très coûteux en termes de calcul. Brièvement présentés dans la première partie, plusieurs travaux ont déjà proposé une gamme assez large de méthodes de filtrage, de débruitage, de redimensionnement de l'image, etc. Toutes les publications rencontrées à ce sujet se concentrent sur la transposition des traitements de l'image du domaine spatial vers le domaine fréquentiel. Il a été convenu de centrer la problématique sur une application potentiellement exploitable dans le domaine de la télédiffusion. Il s'agit d'incruster un logo ajustable en position et en opacité dans un fichier vidéo codé avec la norme MPEG-2, encore couramment utilisée. La transformée appliquée par cet algorithme de compression est la DCT (Discrete Cosine Transform). Un article publié en 1995 traitant de la composition vidéo en général est plus détaillé car il sert de base à cette étude. Certains outils proposés qui reposent sur la linéarité et l'orthogonalité de la transformée seront repris dans le cadre de ce projet, mais la démarche proposée pour résoudre les problèmes temporels est différente. Ensuite, les éléments essentiels de la norme MPEG-2 sont présentés pour en comprendre les mécanismes et également pour exposer la structure d'un fichier codé car, en pratique, ce serait la seule donnée accessible. Le quatrième chapitre de l'étude présente la solution technique mise en oeuvre via un article soumis à IEEE Transactions on Broadcasting. C'est dans cette partie que toutes les subtilités liées au codage sont traitées : la structure en blocs de pixel, la prédiction spatiale, la compensation de mouvement au demi-pixel près, la nécessité ou non de la quantification inverse. À la vue des résultats satisfaisants, la discussion finale porte sur la limite du système : le compromis entre son efficacité, ses degrés de liberté et le degré de décodage du flux

Savoirs UdeS

Fast DCT Domain Filtering Using the DCT and the DST

Author: Neri Merhav
Renato Kresch
Publication venue
Publication date
Field of study

A method for efficient spatial domain filtering, directly in the DCT-IIe domain, is developed and proposed. It consists of using the discrete sine transform (DST), together with the discrete cosine transform (DCT), for transform domain processing, based on the recently derived convolution-multiplication properties of discrete trigonometric transforms. The proposed scheme requires no zero padding of the input data, or kernel symmetry. It is demonstrated that, in typical applications, the proposed algorithm is significantly more efficient than the conventional spatial domain method. The method is applicable to any DCT based data compression standard, such as JPEG, MPEG, and H.261. Keywords: DCT-domain filtering, discrete sine transform, data compression. While on sabbatical leave at Hewlett-Packard Laboratories, 1501 Page Mill Road, Palo Alto, CA 94304, USA. y Address: HP Israel Science Center, Technion City, Haifa 32000, Israel. E-mail: [renato,merhav]@hp.technion.ac.il 1 Introduc..

CiteSeerX