8 research outputs found

    Integrating Reconfigurable Hardware-Based Grid for High Performance Computing

    Get PDF
    FPGAs have shown several characteristics that make them very attractive for high performance computing (HPC). The impressive speed-up factors that they are able to achieve, the reduced power consumption, and the easiness and flexibility of the design process with fast iterations between consecutive versions are examples of benefits obtained with their use. However, there are still some difficulties when using reconfigurable platforms as accelerator that need to be addressed: the need of an in-depth application study to identify potential acceleration, the lack of tools for the deployment of computational problems in distributed hardware platforms, and the low portability of components, among others. This work proposes a complete grid infrastructure for distributed high performance computing based on dynamically reconfigurable FPGAs. Besides, a set of services designed to facilitate the application deployment is described. An example application and a comparison with other hardware and software implementations are shown. Experimental results show that the proposed architecture offers encouraging advantages for deployment of high performance distributed applications simplifying development process

    Gesti贸n de la reconfiguraci贸n din谩mica en dispositivos l贸gicos programables, basada en una arquitectura de objetos distribuidos.

    No full text
    La capacidad de modificaci贸n, en tiempo de ejecuci贸n, de parte de la arquitectura de un dise帽o implementado en un dispositivo l贸gico programable como las Field Programmable Gate Array (FPGA) abre novedosas posibilidades de dise帽o. Es posible modificar parte del mismo mientras el resto permanece en funcionamiento, esto es crear (insertar) o destruir (desalojar) componentes u objetos hardware en nuestro dise帽o, mientras el sistema est谩 en ejecuci贸n. Esto significa que es posible modificar o actualizar el dise帽o a nuevas aplicaciones "sobre la marcha", sin necesidad de redise帽o total del sistema ni de reconfiguraci贸n completa del dispositivo, solo aquellos componentes que vayan a ser modificados o reemplazados. Esta capacidad de reconfiguraci贸n por partes y en tiempo de ejecuci贸n, que llamaremos Reconfiguraci贸n Parcial Din谩mica, permite una flexibilidad de dise帽o sin precedentes, en donde se conjugan varios factores: 驴 reducci贸n del coste y tiempo del proceso de dise帽o, 驴 ahorro de 谩rea involucrada en la FPGA, 驴 reducci贸n de consumo de potencia, 驴 posibilidad de adaptaci贸n de dise帽o a futuras versiones sin necesidad de redise帽o total del nuevo sistema, 驴 incorporaci贸n de nuevas funcionalidades en el mismo espacio en tiempo de ejecuci贸n, de manera de cumplir con los requerimientos variables de las nuevas aplicaciones, (por ejemplo en telefon铆a m贸vil), Actualmente la reconfiguraci贸n din谩mica se lleva a cabo de manera casi artesanal, altamente dependiente de la tecnolog铆a a utilizar y el dise帽o de sistemas din谩micamente reconfigurables o computaci贸n reconfigurable, como se la encuentra en la literatura, presenta una serie de problemas como los siguientes: 驴 c贸mo realizar el proceso de reconfiguraci贸n de manera eficiente (reducir latencia) 驴 c贸mo y cu谩ndo detener/activar un componente (gesti贸n de reconfiguraci贸n) 驴 c贸mo y d贸nde almacenar su estado (persistencia y asignaci贸n de memoria) 驴 c贸mo acceder al nuevo componente (localizaci贸n) 驴 c贸mo lograr la integraci贸n de Ips 驴 c贸mo facilitar la migraci贸n de tareas 驴 c贸mo incorporaci贸n de nuevos componentes una vez desplegado el sistema (din谩mica) En esta tesis se propone una soluci贸n integral, la cual es desarrollada y presentada como un conjunto de servicios que han sido dise帽ados para dar respuesta a cada uno de estos problemas. Este conjunto de servicios, integrados en uno general denominado Servicio de Reconfiguraci贸n Din谩mica del Middleware (SRDM), es otorgado por una arquitectura que est谩 construida sobre un sistema de comunicaciones inspirado en el paradigma de objetos distribuidos denominada Object Oriented Communication Engine (OOCE). Los objetivos concretos de la propuesta son los siguientes: - Proveer una gesti贸n transparente del proceso de reconfiguraci贸n. (Detener componente a - Permitir una directa integraci贸n de objetos dise帽ados por terceros. - Proveer un manejo de la persistencia de estado eficiente y seguro. - Permitir la activaci贸n expl铆cita e impl铆cita de objetos, de forma local o remota. - Facilitar el proceso de migraci贸n de tareas. - Ofrecer servicios de mayor nivel a las aplicaciones/sistema operativo El SRDM es un servicio complejo que requiere el manejo de aspectos tales como reserva de memoria, instanciaci贸n f铆sica de objetos, manejo de tablas, transferencia de datos, etc. Para ello se propone el siguiente conjunto de servicios b谩sicos que se a帽aden al modelo de comunicaci贸n: 驴 Servicio de Asignaci贸n/Reserva de Memoria (Memory Allocation Service) 驴 Servicio de Ubicaci贸n de objetos (Object Locator Service) 驴 Servicio de Factor铆a de Objetos (Object Factory Service). Adem谩s, se propone un modelo para el manejo de la persistencia de estado, que permite la continuaci贸n de ejecuci贸n de m茅todos de objetos que son reinsertados en el sistema y han sido previamente desalojados, y para facilitar el proceso de migraci贸n de tareas. Estos servicios son solicitados y manejados por un componente denominado Reconfiguration Controller (RController) el cual se encarga de la gesti贸n del proceso de reconfiguraci贸n parcial din谩mica. Este componente m谩s los servicios descritos forman el Servicio de Reconfiguraci贸n Din谩mica del Middleware. Aportaciones Las principales aportaciones realizadas en esta tesis son: a) La definici贸n de un servicio de reconfiguraci贸n din谩mica que ofrece las siguientes prestaciones: 1) Gestiona el proceso de manera eficiente tanto local como remotamente y reduce dr谩sticamente el tiempo de reconfiguraci贸n. 2) Permite la incorporaci贸n din谩mica de nuevos objetos al sistema una vez desplegado, que no fueron previstos durante el dise帽o del mismo, resolviendo inconvenientes tales como: a) proveer identidad 煤nica a los nuevos objetos, b) otorgarle su direcci贸n base dentro del mapa de memoria del sistema, c) conocer el tama帽o del estado de cada uno de estos nuevos objetos para reservar espacio en memoria, d) reservar este espacio de memoria y registrar su direcci贸n base, e) registrar la direcci贸n donde est谩 almacenado el bitstream parcial correspondiente a cada objeto nuevo. Estos inconvenientes son resueltos a trav茅s de sus servicios de localizaci贸n de objetos y de asignaci贸n din谩mica de memoria. 3) Aumenta la capacidad del proceso de reconfiguraci贸n permitiendo su activaci贸n no solamente de manera expl铆cita sino tambi茅n impl铆citamente. 4) Provee un modelo de manejo de la persistencia eficiente y seguro, que permite detener y reiniciar la ejecuci贸n de los m茅todos de los objetos que se intercambian y facilita, adem谩s, la migraci贸n de tareas de un objeto a otro, Hw o Sw, en tiempo de ejecuci贸n, sin p茅rdida de datos ni de estados. 5) Ofrece una misma interfaz para los objetos en 谩reas est谩ticas y 谩reas reconfigurables. b) El SRDM a trav茅s de sus servicios de gesti贸n del proceso de reconfiguraci贸n, integraci贸n de componentes, servicio de locaci贸n de objetos, el servicio de persistencia, servicio de activaci贸n expl铆cita e impl铆cita de objetos, servicio de migraci贸n de tareas, forma la base para la edificaci贸n de aplicaciones o la construcci贸n de un sistema operativo distribuido de m谩s alto nivel

    Dense monocular Simultaneous Localization and Mapping by direct surfel optimization

    Get PDF
    This work presents a novel approach for monocular dense Simultaneous Localization and Mapping. The surface to be estimated is represented as a piecewise planar surface, defined as a group of surfels each having as parameters the position and normal. These parameters are directly estimated from the raw camera pixels measurements using a Gauss-Newton iterative process. The representation of the surface as a group of surfels has many advantages. First, it allows recovering robust and accurate pixel depths, without the need to use a computationally demanding depth regularization schema. This has the further advantage of avoiding the use of a physically unlikely surface smoothness prior. What is more, new surfels can be correctly initialized from the information present in nearby surfels, avoiding also the need to use an expensive initialization routine commonly needed in Gauss-Newton methods. The method was written in the GLSL shading language, allowing the use of GPU devices and achieve real-time processing. The method was tested on benchmark datasets, showing both its depth and normal estimation capacity, and its quality to recover the original scene. Results presented in this work showcase the usefulness of the more physically grounded piecewise planar scene depth prior, instead of the more commonly pixel depth independence and smoothness prior.Fil: Trabes, Emanuel. Universidad Nacional de San Luis. Facultad de Ciencias F铆sico Matem谩ticas y Naturales. Departamento de Electr贸nica; Argentina. Consejo Nacional de Investigaciones Cient铆ficas y T茅cnicas. Centro Cient铆fico Tecnol贸gico Conicet - San Luis; ArgentinaFil: Avila, Luis Omar. Consejo Nacional de Investigaciones Cient铆ficas y T茅cnicas. Centro Cient铆fico Tecnol贸gico Conicet - San Luis; Argentina. Universidad Nacional de San Luis. Facultad de Ciencias F铆sico Matem谩ticas y Naturales. Departamento de Inform谩tica. Laboratorio Investigaci贸n y Desarrollo en Inteligencia Computacional; ArgentinaFil: Dondo Gazzano, Julio Daniel. Universidad Nacional de San Luis. Facultad de Ciencias F铆sico Matem谩ticas y Naturales. Departamento de Electr贸nica; ArgentinaFil: Sosa Paez, Carlos Federico. Universidad Nacional de San Luis. Facultad de Ciencias F铆sico Matem谩ticas y Naturales. Departamento de Electr贸nica; Argentin

    Facilitating Preemptive Hardware System Design Using Partial Reconfiguration Techniques

    Get PDF
    In FPGA-based control system design, partial reconfiguration is especially well suited to implement preemptive systems. In real-time systems, the deadline for critical task can compel the preemption of noncritical one. Besides, an asynchronous event can demand immediate attention and, then, force launching a reconfiguration process for high-priority task implementation. If the asynchronous event is previously scheduled, an explicit activation of the reconfiguration process is performed. If the event cannot be previously programmed, such as in dynamically scheduled systems, an implicit activation to the reconfiguration process is demanded. This paper provides a hardware-based approach to explicit and implicit activation of the partial reconfiguration process in dynamically reconfigurable SoCs and includes all the necessary tasks to cope with this issue. Furthermore, the reconfiguration service introduced in this work allows remote invocation of the reconfiguration process and then the remote integration of off-chip components. A model that offers component location transparency is also presented to enhance and facilitate system integration

    Heterogeneous SoC-based acceleration of MPEG-7 compliance image retrieval process

    No full text
    With the growing amount of multimedial content over the internet and broadcast systems, mechanisms for efficient information organization, manipulation and transmission are becoming indispensable. Optimization of the multimedia search and retrieval processes is nowadays an important area of development due to the difficulty to browse, filter and manage that big amount of data. The adoption of the MPEG-7 standard has a significant importance to simplify the image retrieval process. However, performance issues are still relevant when the retrieval must be accomplished in real time. This work presents an innovative and efficient approach of a Content-Based Retrieval Process using metric spaces implemented in heterogeneous resources according to the demand of computational power. Several implementations were made and comparative results are shown evidencing the benefits of the proposed approach.Fil: Molina, Romina. Universidad Nacional de San Luis; ArgentinaFil: Dondo Gazzano, Julio Daniel. Universidad de Castilla-La Mancha; Espa帽aFil: Rincon, Fernando. Universidad de Castilla-La Mancha; Espa帽aFil: Gil Costa, Graciela Ver贸nica. Consejo Nacional de Investigaciones Cient铆ficas y T茅cnicas. Centro Cient铆fico Tecnol贸gico Conicet - San Luis; Argentina. Universidad Nacional de San Luis; ArgentinaFil: Barba, Jesus. Universidad de Castilla-La Mancha; Espa帽aFil: Petrino, Ricardo. Universidad Nacional de San Luis; ArgentinaFil: Lopez, Juan Carlos. Universidad de Castilla-La Mancha; Espa帽

    Hardware Acceleration of CBIR System with FPGA-Based Platform

    No full text
    Typical applications involving image retrieval processes demand a great amount of computation. The visual content of the images is extracted and represented by means of descriptor vectors of multidimensional characteristics. The image retrieval process consists of two tasks: (1) generation of database and indexing; and (2) the search process. The first task involves the construction of descriptor vectors. Then, an index is built upon the database to speed the search process. The second requires calculating a descriptor vector for the query image and computes the similarity search with the ones stored in the index. In this context, it is relevant to devise new algorithms and different parallel platforms that can reduce execution times. In particular, this work focuses on platforms with FPGAs based SoCs to present and evaluate a two stage system where the index is constructed off-line and the similarity search is executed on-line. Results show that the FPGA is 73% faster than a 2 Quad CPU to compute the descriptor vector of an image when using the Color Layout Descriptor of MPEG-7.Fil: Gil Costa, Graciela Ver贸nica. Consejo Nacional de Investigaciones Cient铆ficas y T茅cnicas. Centro Cient铆fico Tecnol贸gico Conicet - San Luis; Argentina. Universidad Nacional de San Luis. Facultad de Ciencias Fisico Matematicas y Naturales. Departamento de Informatica; ArgentinaFil: Molina, Romina Soledad. Universidad Nacional de San Luis. Facultad de Ciencias F铆sico Matem谩ticas y Naturales. Departamento de F铆sica; ArgentinaFil: Petrino, Ricardo. Universidad Nacional de San Luis. Facultad de Ciencias F铆sico Matem谩ticas y Naturales. Departamento de F铆sica; ArgentinaFil: Sosa Paez, Carlos Federico. Universidad Nacional de San Luis. Facultad de Ciencias F铆sico Matem谩ticas y Naturales. Departamento de F铆sica; ArgentinaFil: Printista, Alicia Marcela. Consejo Nacional de Investigaciones Cient铆ficas y T茅cnicas. Centro Cient铆fico Tecnol贸gico Conicet - San Luis; Argentina. Universidad Nacional de San Luis. Facultad de Ciencias Fisico Matematicas y Naturales. Departamento de Informatica; ArgentinaFil: Dondo Gazzano, Julio Daniel. Universidad de Castilla-La Mancha; Espa帽
    corecore