7 research outputs found

    Acelerando los momentos de Zernike sobre Kepler

    Get PDF
    Este trabajo analiza las caracter铆sticas m谩s avanzadas de la arquitectura Kepler de Nvidia, principalmente el paralelismo din谩mico para el lanzamiento de kernels desde la GPU y la planificaci贸n de hilos con Hyper-Q. Posteriormente, ilustra diversas formas de aprovecharlas en un c贸digo que computa los momentos de Zernike, y que admite formulaciones directa y recursiva. Hemos podido as铆 contrastar las posibilidades que ambas ofrecen para maximizar rendimiento en las nuevas GPUs, la primera desplegando todo el paralelismo, y la segunda aumentando la intensidad aritm茅tica gracias a la amortizaci贸n de resultados procedentes de iteraciones previas. Esto nos ha permitido aumentar los factores de aceleraci贸n que ya logramos anteriormente con arquitecturas Fermi frente a la versi贸n C ejecutada en una CPU multicore de su misma generaci贸n. Logramos tambi茅n identificar la carga de trabajo cr铆tica que necesita un c贸digo para mejorar su ejecuci贸n en las nuevas plataformas dotadas de seis veces m谩s n煤cleos computacionales, y cuantificar la sobrecarga introducida por los nuevos mecanismos de programaci贸n din谩mica en CUDA.Universidad de M谩laga. Campus de Excelencia Internacional Andaluc铆a Tec

    User identification system for inked fingerprint pattern based on central moments

    Get PDF
    The use of the fingerprint recognition has been and remains very important in many security applications and licensing systems. Fingerprint recognition is required in many areas such as licensing access to networks, corporate computers and organizations. In this paper, the system of fingerprint recognition that can be used in several cases of fingerprint such as being rounded at an angle by a randomly inked fingerprint on paper. So, fingerprint image is tooked at a different angle in order to identify the owner of the ink fingerprint. This method involves two working levels. The first one, the fingerprint pattern's shape features are calculated based on the central moments of each image being listed on a regular basis with three states rotation. Each image is rotated at a specified angle. In the second level, the fingerprint holder entered is identified using the previously extracted shape features and compared to the three local databases content of three rotation states. When applied the method for several persons by taken their inked fingerprint on the paper, the accuracy of the system in identifying the owner of the fingerprint after rotation states were close to 83.71

    Digital Filters and Signal Processing

    Get PDF
    Digital filters, together with signal processing, are being employed in the new technologies and information systems, and are implemented in different areas and applications. Digital filters and signal processing are used with no costs and they can be adapted to different cases with great flexibility and reliability. This book presents advanced developments in digital filters and signal process methods covering different cases studies. They present the main essence of the subject, with the principal approaches to the most recent mathematical models that are being employed worldwide

    Clasificaci贸n Tisular en GPU: aceleraci贸n y optimizaciones

    Get PDF
    Desde hace una d茅cada, los procesadores gr谩ficos o GPUs vienen ganando protagonismo en la computaci贸n de altas prestaciones, contribuyendo a la aceleraci贸n de miles de aplicaciones en multitud de 谩reas de la ciencia. Pero m谩s que esta conquista, lo que ha hecho singular al movimiento GPGPU ha sido la v铆a para su consecuci贸n, ofreciendo tecnolog铆a popular, barata y notablemente arropada. Como resultado, la supercomputaci贸n est谩 hoy al alcance de cualquier usuario y empresa, democratizando un sector hasta entonces circunscrito a unos pocos centros elitistas. El auge de las GPUs en los entornos de altas prestaciones ha generado un reto a la comunidad de desarrolladores software. Los programadores est谩n habituados a pensar y programar de manera secuencial, y s贸lo una minor铆a se atrev铆a hace 10 a帽os a adentrarse en este mundo. La programaci贸n paralela es una tarea compleja que exige otras habilidades y modelo de razonamiento, adem谩s de conocer nuevos conceptos hardware, algoritmos y herramientas de programaci贸n. Poco a poco, esta percepci贸n ha ido cambiando gracias a la aportaci贸n de aquellos que, conscientes de la dificultad, quisieron aportar su granito de arena para facilitar esta transici贸n. El trabajo de esta tesis recoge este esp铆ritu. Planteamos nuevos dise帽os e implementaciones de algoritmos en el 谩mbito de la biocomputaci贸n para evaluar el rendimiento de las GPUs m谩s destacadas durante la 煤ltima d茅cada, desde equipos con una 煤nica GPU hasta supercomputadores de 32 GPUs. En cada uno de los problemas de biocomputaci贸n se han analizado todas las caracter铆sticas relevantes de la GPU que permiten exprimir su gran potencial, para as铆 presentar de una manera did谩ctica y rigurosa un estudio pormenorizado de los detalles y t茅cnicas de programaci贸n m谩s acordes a cada tipo de algoritmo. Cronol贸gicamente, la aparici贸n de la arquitectura de c谩lculo paralelo CUDA para GPUs es un hito de especial importancia en la programaci贸n de algoritmos de prop贸sito general en GPUs. Nuestro trabajo comenz贸 en la era pre-CUDA con una aplicaci贸n de detecci贸n de c铆rculos basada en la transformada de Hough y un algoritmo de detecci贸n del tumor neuroblastoma. Sus implementaciones explotan la GPU desde una perspectiva m谩s artesanal, empleando un gran abanico de unidades funcionales de la GPU. Para ello fueron necesarios buenos conocimientos del cauce de segmentaci贸n gr谩fico y ciertas dosis de creatividad. Lo habitual en aquella 茅poca era aprovechar casi de forma exclusiva los procesadores de p铆xeles, al ser los m谩s numerosos y mostrar ya claros indicios de escalabilidad. Entre tanto, nuestro estudio se dedic贸 a mostrar el potencial de otros recursos menos populares, como los procesadores de v茅rtices, el rasterizador (conversi贸n de pol铆gonos en p铆xeles) y las unidades de blending (mezclado de contenidos en pantalla). Con la irrupci贸n de CUDA, nuestra atenci贸n se dirigi贸 a aplicaciones m谩s exigentes, como el registro de im谩genes o el c谩lculo de los momentos de Zernike para caracterizar regiones tisulares. Completamos tambi茅n nuestro estudio del neuroblastoma, para poder as铆 contrastar las facilidades aportadas por CUDA y sus posibilidades de optimizaci贸n. Respecto a las arquitecturas gr谩ficas objeto de nuestro an谩lisis, comenzamos nuestra andadura con modestas GeForce, prosiguiendo con Quadro de gama alta, y concluyendo con Tesla de prop贸sito general, justo donde muchos se iniciaron en el mundo GPGPU para tomar el relevo. La longevidad del algoritmo de detecci贸n de tumores nos ha permitido comparar evolutivamente todas estas arquitecturas, el registro de im谩genes, ilustrar el beneficio de apoyarse en una popular librer铆a como cuFFT, y los momentos de Zernike, desvelar las exigencias para optimizar el c贸digo en generaciones venideras (en nuestro caso, Fermi y Kepler). La exploraci贸n de este amplio abanico de posibilidades, tanto en la vertiente software como en la diversidad de modelos hardware que nos han acompa帽ado, desemboca en un sinf铆n de aportaciones que, adem谩s de contribuir a una aceleraci贸n de hasta dos 贸rdenes de magnitud en comparaci贸n con CPUs de su misma gama, han permitido que el trabajo de esta tesis siente las bases de otras muchas l铆neas de investigaci贸n que han dado cr茅dito y continuidad a nuestro esfuerzo
    corecore