3 research outputs found
Optimization of scientific algorithms in heterogeneous systems and accelerators for high performance computing
Actualmente, la computaci贸n de prop贸sito general en GPU es uno de los pilares b谩sicos
de la computaci贸n de alto rendimiento. Aunque existen cientos de aplicaciones
aceleradas en GPU, a煤n hay algoritmos cient铆ficos poco estudiados. Por ello, la
motivaci贸n de esta tesis ha sido investigar la posibilidad de acelerar significativamente
en GPU un conjunto de algoritmos pertenecientes a este grupo.
En primer lugar, se ha obtenido una implementaci贸n optimizada del algoritmo de
compresi贸n de v铆deo e imagen CAVLC (Context-Adaptive Variable Length Encoding), que
es el m茅todo entr贸pico m谩s usado en el est谩ndar de codificaci贸n de v铆deo H.264. La
aceleraci贸n respecto a la mejor implementaci贸n anterior est谩 entre 2.5x y 5.4x. Esta
soluci贸n puede aprovecharse como el componente entr贸pico de codificadores H.264
software, y utilizarse en sistemas de compresi贸n de v铆deo e imagen en formatos
distintos a H.264, como im谩genes m茅dicas.
En segundo lugar, se ha desarrollado GUD-Canny, un detector de bordes de Canny no
supervisado y distribuido. El sistema resuelve las principales limitaciones de las
implementaciones del algoritmo de Canny, que son el cuello de botella causado por el
proceso de hist茅resis y el uso de umbrales de hist茅resis fijos. Dada una imagen, esta
se divide en un conjunto de sub-im谩genes, y, para cada una de ellas, se calcula de forma
no supervisada un par de umbrales de hist茅resis utilizando el m茅todo de MedinaCarnicer. El detector satisface el requisito de tiempo real, al ser 0.35 ms el tiempo
promedio en detectar los bordes de una imagen 512x512.
En tercer lugar, se ha realizado una implementaci贸n optimizada del m茅todo de
compresi贸n de datos VLE (Variable-Length Encoding), que es 2.6x m谩s r谩pida en
promedio que la mejor implementaci贸n anterior. Adem谩s, esta soluci贸n incluye un
nuevo m茅todo scan inter-bloque, que se puede usar para acelerar la propia operaci贸n
scan y otros algoritmos, como el de compactaci贸n. En el caso de la operaci贸n scan, se
logra una aceleraci贸n de 1.62x si se usa el m茅todo propuesto en lugar del utilizado en la
mejor implementaci贸n anterior de VLE.
Esta tesis doctoral concluye con un cap铆tulo sobre futuros trabajos de investigaci贸n que
se pueden plantear a partir de sus contribuciones