2 research outputs found

    Optimizations for real-time implementation of H264/AVC video encoder on DSP processor

    Get PDF
    International audienceReal-time H.264/AVC high definition video encoding represents a challenging workload to most existing programmable processors. The new technologies of programmable processors such as Graphic Processor Unit (GPU) and multicore Digital signal Processor (DSP) offer a very promising solution to overcome these constraints. In this paper, an optimized implementation of H264/AVC video encoder on a single core among the six cores of TMS320C6472 DSP for Common Intermediate Format (CIF) (352x288) resolution is presented in order to move afterwards to a multicore implementation for standard and high definitions (SD,HD).Algorithmic optimization is applied to the intra prediction module to reduce the computational time. Furthermore, based on the DSP architectural features, various structural and hardware optimizations are adopted to minimize external memory access. The parallelism between CPU processing and data transfers is fully exploited using an Enhanced Direct Memory Access controller (EDMA). Experimental results show that the whole proposed optimizations, on a single core running at 700 MHz for CIF resolution, improve the encoding speed by up to 42.91%. They allow reaching the real-time encoding 25 f/s without inducing any Peak Signal to Noise Ratio (PSNR) degradation or bit-rate increase and make possible to achieve real time implementation for SD and HD resolutions when exploiting multicore features

    Optimization of scientific algorithms in heterogeneous systems and accelerators for high performance computing

    Get PDF
    Actualmente, la computaci贸n de prop贸sito general en GPU es uno de los pilares b谩sicos de la computaci贸n de alto rendimiento. Aunque existen cientos de aplicaciones aceleradas en GPU, a煤n hay algoritmos cient铆ficos poco estudiados. Por ello, la motivaci贸n de esta tesis ha sido investigar la posibilidad de acelerar significativamente en GPU un conjunto de algoritmos pertenecientes a este grupo. En primer lugar, se ha obtenido una implementaci贸n optimizada del algoritmo de compresi贸n de v铆deo e imagen CAVLC (Context-Adaptive Variable Length Encoding), que es el m茅todo entr贸pico m谩s usado en el est谩ndar de codificaci贸n de v铆deo H.264. La aceleraci贸n respecto a la mejor implementaci贸n anterior est谩 entre 2.5x y 5.4x. Esta soluci贸n puede aprovecharse como el componente entr贸pico de codificadores H.264 software, y utilizarse en sistemas de compresi贸n de v铆deo e imagen en formatos distintos a H.264, como im谩genes m茅dicas. En segundo lugar, se ha desarrollado GUD-Canny, un detector de bordes de Canny no supervisado y distribuido. El sistema resuelve las principales limitaciones de las implementaciones del algoritmo de Canny, que son el cuello de botella causado por el proceso de hist茅resis y el uso de umbrales de hist茅resis fijos. Dada una imagen, esta se divide en un conjunto de sub-im谩genes, y, para cada una de ellas, se calcula de forma no supervisada un par de umbrales de hist茅resis utilizando el m茅todo de MedinaCarnicer. El detector satisface el requisito de tiempo real, al ser 0.35 ms el tiempo promedio en detectar los bordes de una imagen 512x512. En tercer lugar, se ha realizado una implementaci贸n optimizada del m茅todo de compresi贸n de datos VLE (Variable-Length Encoding), que es 2.6x m谩s r谩pida en promedio que la mejor implementaci贸n anterior. Adem谩s, esta soluci贸n incluye un nuevo m茅todo scan inter-bloque, que se puede usar para acelerar la propia operaci贸n scan y otros algoritmos, como el de compactaci贸n. En el caso de la operaci贸n scan, se logra una aceleraci贸n de 1.62x si se usa el m茅todo propuesto en lugar del utilizado en la mejor implementaci贸n anterior de VLE. Esta tesis doctoral concluye con un cap铆tulo sobre futuros trabajos de investigaci贸n que se pueden plantear a partir de sus contribuciones
    corecore