5 research outputs found

    An Efficient Algorithm for VC-1 to H.264 Video Transcoding in Progressive Compression

    Full text link
    The high definition video adoption has been growing rapidly for the last two years. The two high definition DVD formats HD-DVD and Blueray have mandated MPEG-2, H.264 and VC-1 as video compression formats. The coexistence of these different video coding standards creates a need for transcoding. In this paper, an efficient transcoding algorithm from VC-1 video to H.264 video is discussed. While there has been recent work on MPEG-2 to H.264 transcoding, the published work on VC-1 to H.264 transcoding is non-existent. There is very limited amount of published work on VC-1. This paper gives a brief overview of VC-1 and discusses the opportunities for low-complexit

    Very low complexity mpeg-2 to h.264 transcoding using machine learning

    Get PDF
    ABSTRACT This paper presents a novel macroblock mode decision algorithm for inter-frame prediction based on machine learning techniques to be used as part of a very low complexity MPEG-2 to H.264 video transcoder. Since coding mode decisions take up the most resources in video transcoding, a fast macro block (MB) mode estimation would lead to reduced complexity. The proposed approach is based on the hypothesis that MB coding mode decisions in H.264 video have a correlation with the distribution of the motion compensated residual in MPEG-2 video. We use machine learning tools to exploit the correlation and derive decision trees to classify the incoming MPEG-2 MBs into one of the 11 coding modes in H.264. The proposed approach reduces the H.264 MB mode computation process into a decision tree lookup with very low complexity. The proposed transcoder is compared with a reference transcoder comprised of a MPEG-2 decoder and an H.264 encoder. Our results show that the proposed transcoder reduces the H.264 encoding time by over 95% with negligible loss in quality and bitrate

    MPEG-4 to H.264 Transcoding using Macroblock Statistics

    No full text
    Abstract — In this paper, a temporal resolution reduction transcoding method that transforms an MPEG-4 video bitstream into an H.264 video bitstream is proposed. The block mode statistics and motion vectors in the MPEG-4 bitstream are utilized in the H.264 encoder for block mode conversion and motion vector interpolation methods. The proposed motion vector interpolation methods are developed not to perform brute-force motion estimation again in the H.264. In the experimental results, the proposed methods achieve 3~4 times improvement in computational complexity compared to the cascade pixel-domain transcoding, while the PSNR (peak signal to noise ratio) is degraded with 0.2~0.9dB depending on the bitrates

    Système unifié de transcodage vidéo permettant la réalisation d'une combinaison d'opérations de transcodage

    Get PDF
    Au fil des années, l'utilisation de la vidéo dans la vie quotidienne ne cesse d'augmenter, surtout grâce à l'explosion d'Internet et l'usage massif des différentes sortes d'appareils mobiles : téléphones cellulaires, assistants personnels numériques (PDA), téléphones intelligents, etc. Ces derniers ont nettement surpassé, en nombre, les ordinateurs personnels. L'hétérogénéité des réseaux (filaires, sans-fils, fibres optiques, ... ), la diversité des appareils ainsi que la variété des applications multimédias utilisées rendent indispensable l'adaptation du contenu multimédia afin de permettre un accès universel et transparent aux usagers finaux. Le transcodage vidéo est une technologie inévitable qui permet de répondre à ce problème en transformant la vidéo encodée selon les nouveaux besoins de transmission et/ou de l'usager. Le transcodage est devenu donc un sujet de recherche très actif où plusieurs architectures et systèmes de transcodage ont été proposés pour les différents cas d'utilisation : adaptation du débit binaire, adaptation de la résolution spatiale, adaptation de la résolution temporelle, adaptation du format (standard), insertion de logo, etc. Cependant, la majorité des solutions proposées sont le résultat d'études de ces cas d'utilisation de transcodage vidéo pris séparément. Dans ce projet, nous analysons les différentes architectures vidéo présentées dans la littérature et nous proposerons une architecture unifiée permettant de réaliser efficacement différentes combinaisons d'opérations de transcodage dans un seul système. Ensuite nous proposons des variantes aux algorithmes de transcodage existants qui sont mieux adaptées à notre système. Ce nouveau système de transcodage est implémenté et les performances validées à l'aide de simulations sur plusieurs combinaisons d'opérations de transcodage. Nos résultats montrent que des gains permettant de supporter 2.6 fois plus de canaux, en moyenne sur un processeur Intel, sont obtenus pour 1' adaptation du débit binaire de 512 à 384 kb/s avec une perte mineure en PSNR de -0.12 dB et des gains de 2.14 en moyenne pour l'adaptation de la résolution spatiale de 512 à 256 kb/s avec une perte de -0.95 dB. Pour 1' adaptation de format de 512 à 512 kb/s, nos résultats montrent des gains de 1.84 fois plus de canaux en moyenne avec une perte en PSNR de - 1.14 dB et pour l'adaptation de format avec adaptation de la résolution spatiale de 256 à 32 kb/s des gains de 1.19 en moyenne avec une perte -0.41 dB ont été obtenus

    Transcodage rapide de H.264 à HEVC basé sur la propagation du mouvement et une traversée postfixe des unités de codage arborescent

    Get PDF
    En 2013, l’ITU-T et l’ISO ont publié conjointement le plus récent standard de compression vidéo, appelé HEVC. Comparé à son prédécesseur, H.264, ce nouveau standard réduit le débit d’environ 50% pour une qualité vidéo similaire. Pour bénéficier de cette plus grande efficacité de codage, et pour assurer l’interopérabilité entre les systèmes, plusieurs séquences vidéos H.264 doivent être transcodées (converties) en séquences HEVC. La manière la plus simple de réaliser cette opération consiste à décoder entièrement la séquence H.264 source, puis à la réencoder entièrement à l’aide d’un encodeur HEVC. Cette approche, appelée transcodage en cascade dans le domaine des pixels (TCDP), produit un codage efficace et offre un maximum de flexibilité, notamment en ce qui a trait à la configuration de la séquence de sortie. Cependant, elle est très complexe en calculs. Pour réduire cette complexité, plusieurs approches réutilisent de l’information de codage (vecteurs de mouvement, modes de codage, données résiduelles, etc.) extraite de la séquence H.264, afin d’accélérer certaines étapes de l’encodage HEVC. La majorité de ces approches préserve l’efficacité de codage, mais obtient cependant des accélérations limitées (habituellement, entre 2 et 4x, selon l’approche). Dans cette thèse, nous proposons une approche de transcodage H.264 à HEVC plus rapide que celles présentées dans la littérature. Notre solution est composée d’un algorithme de propagation du mouvement et d’une méthode pour réduire le nombre de modes HEVC à tester. L’algorithme de propagation de mouvement crée une liste des vecteurs de mouvement candidats au niveau des unités de codage arborescent (CTU) et, par la suite, sélectionne le meilleur candidat au niveau des unités de prédiction. Cette méthode élimine la redondance des calculs en précalculant l’erreur de prédiction de chaque candidat au niveau des CTUs, et réutilise cette information pour différentes tailles de partitionnement. Pour sa part, l’algorithme de réduction des modes est basé sur un parcours postfixe de la CTU traitée. Cet algorithme permet notamment d’arrêter prématurément le traitement d’un mode jugé non prometteur. Par rapport à une approche de transcodage TCDP, nos résultats expérimentaux montrent que la solution proposée est en moyenne 7.81 fois plus rapide, pour une augmentation moyenne du BD-Rate de 2.05%. Nous expériences montrent également que les résultats obtenus sont significativement supérieurs à ceux de l’état de l’art
    corecore