36 research outputs found

    On the architecture of H.264 to H.264 homogeneous transcoding platform

    Get PDF
    2007-2008 > Academic research: refereed > Invited conference paperVersion of RecordPublishe

    On the architecture of H.264 to H.264 homogeneous transcoding platform

    Full text link

    No-reference analysis of decoded MPEG images for PSNR estimation and post-processing

    Get PDF
    We propose no-reference analysis and processing of DCT (Discrete Cosine Transform) coded images based on estimation of selected MPEG parameters from the decoded video. The goal is to assess MPEG video quality and perform post-processing without access to neither the original stream nor the code stream. Solutions are presented for MPEG-2 video. A method to estimate the quantization parameters of DCT coded images and MPEG I-frames at the macro-block level is presented. The results of this analysis is used for deblocking and deringing artifact reduction and no-reference PSNR estimation without code stream access. An adaptive deringing method using texture classification is presented. On the test set, the quantization parameters in MPEG-2 I-frames are estimated with an overall accuracy of 99.9% and the PSNR is estimated with an overall average error of 0.3dB. The deringing and deblocking algorithms yield improvements of 0.3dB on the MPEG-2 decoded test sequences

    Video transcoding: an overview of various techniques and research issues

    Full text link

    Algorithms and methods for video transcoding.

    Get PDF
    Video transcoding is the process of dynamic video adaptation. Dynamic video adaptation can be defined as the process of converting video from one format to another, changing the bit rate, frame rate or resolution of the encoded video, which is mainly necessitated by the end user requirements. H.264 has been the predominantly used video compression standard for the last 15 years. HEVC (High Efficiency Video Coding) is the latest video compression standard finalised in 2013, which is an improvement over H.264 video compression standard. HEVC performs significantly better than H.264 in terms of the Rate-Distortion performance. As H.264 has been widely used in the last decade, a large amount of video content exists in H.264 format. There is a need to convert H.264 video content to HEVC format to achieve better Rate-Distortion performance and to support legacy video formats on newer devices. However, the computational complexity of HEVC encoder is 2-10 times higher than that of H.264 encoder. This makes it necessary to develop low complexity video transcoding algorithms to transcode from H.264 to HEVC format. This research work proposes low complexity algorithms for H.264 to HEVC video transcoding. The proposed algorithms reduce the computational complexity of H.264 to HEVC video transcoding significantly, with negligible loss in Rate-Distortion performance. This work proposes three different video transcoding algorithms. The MV-based mode merge algorithm uses the block mode and MV variances to estimate the split/non-split decision as part of the HEVC block prediction process. The conditional probability-based mode mapping algorithm models HEVC blocks of sizes 16×16 and lower as a function of H.264 block modes, H.264 and HEVC Quantisation Parameters (QP). The motion-compensated MB residual-based mode mapping algorithm makes the split/non-split decision based on content-adaptive classification models. With a combination of the proposed set of algorithms, the computational complexity of the HEVC encoder is reduced by around 60%, with negligible loss in Rate-Distortion performance, outperforming existing state-of-art algorithms by 20-25% in terms of computational complexity. The proposed algorithms can be used in computation-constrained video transcoding applications, to support video format conversion in smart devices, migration of large-scale H.264 video content from host servers to HEVC, cloud computing-based transcoding applications, and also to support high quality videos over bandwidth-constrained networks

    Objective and Subjective Evaluation of Spatially Transcoded Videos for Mobile Receivers

    Get PDF
    Digital television produces video signals with different bit rates, encoding formats, and spatial resolutions. To deliver video to users with different receivers, the content needs to be dynamically adapted. Transcoding devices convert video from one format into another. The reception of digital videos using mobile receivers, implies that the spatial resolution of the video must be adjusted to fit the small display. This paper presents subjective and objective quality analysis of spatially transcoded videos. Transcoding algorithms that downsample the video frames using the moving average, median, mode, weighted average and sigma filters are considered

    Système unifié de transcodage vidéo permettant la réalisation d'une combinaison d'opérations de transcodage

    Get PDF
    Au fil des années, l'utilisation de la vidéo dans la vie quotidienne ne cesse d'augmenter, surtout grâce à l'explosion d'Internet et l'usage massif des différentes sortes d'appareils mobiles : téléphones cellulaires, assistants personnels numériques (PDA), téléphones intelligents, etc. Ces derniers ont nettement surpassé, en nombre, les ordinateurs personnels. L'hétérogénéité des réseaux (filaires, sans-fils, fibres optiques, ... ), la diversité des appareils ainsi que la variété des applications multimédias utilisées rendent indispensable l'adaptation du contenu multimédia afin de permettre un accès universel et transparent aux usagers finaux. Le transcodage vidéo est une technologie inévitable qui permet de répondre à ce problème en transformant la vidéo encodée selon les nouveaux besoins de transmission et/ou de l'usager. Le transcodage est devenu donc un sujet de recherche très actif où plusieurs architectures et systèmes de transcodage ont été proposés pour les différents cas d'utilisation : adaptation du débit binaire, adaptation de la résolution spatiale, adaptation de la résolution temporelle, adaptation du format (standard), insertion de logo, etc. Cependant, la majorité des solutions proposées sont le résultat d'études de ces cas d'utilisation de transcodage vidéo pris séparément. Dans ce projet, nous analysons les différentes architectures vidéo présentées dans la littérature et nous proposerons une architecture unifiée permettant de réaliser efficacement différentes combinaisons d'opérations de transcodage dans un seul système. Ensuite nous proposons des variantes aux algorithmes de transcodage existants qui sont mieux adaptées à notre système. Ce nouveau système de transcodage est implémenté et les performances validées à l'aide de simulations sur plusieurs combinaisons d'opérations de transcodage. Nos résultats montrent que des gains permettant de supporter 2.6 fois plus de canaux, en moyenne sur un processeur Intel, sont obtenus pour 1' adaptation du débit binaire de 512 à 384 kb/s avec une perte mineure en PSNR de -0.12 dB et des gains de 2.14 en moyenne pour l'adaptation de la résolution spatiale de 512 à 256 kb/s avec une perte de -0.95 dB. Pour 1' adaptation de format de 512 à 512 kb/s, nos résultats montrent des gains de 1.84 fois plus de canaux en moyenne avec une perte en PSNR de - 1.14 dB et pour l'adaptation de format avec adaptation de la résolution spatiale de 256 à 32 kb/s des gains de 1.19 en moyenne avec une perte -0.41 dB ont été obtenus
    corecore