181 research outputs found

    Comparación de rendimiento y esfuerzo de programación entre Rust y C en arquitecturas multicore : Caso de estudio: Simulación de N cuerpos computacionales

    Get PDF
    Históricamente, Fortran y C han sido los lenguajes de programación por defecto en la computación de alto rendimiento (High-Performance Computing, HPC). Ambos ofrecen al programador primitivas y funciones que permiten manipular la memoria del sistema e interactuar directamente con el hardware subyacente, resultando en un código eficiente tanto en tiempos de respuesta como en uso de recursos. Como contrapartida, resulta un verdadero desafío generar código que sea mantenible y escalable a lo largo del tiempo en estos tipos de lenguajes. En el 2010 surge Rust, un nuevo lenguaje de programación diseñado para aplicaciones concurrentes y seguras, que adopta características de lenguajes procedurales, orientados a objetos y funcionales. Entre sus principios de diseño, Rust busca igualar a C en términos de eficiencia pero aumentado la seguridad y la productividad del código. Este trabajo presenta un estudio comparativo entre C y Rust en términos de rendimiento y esfuerzo de programación, seleccionando como caso de estudio la simulación de N cuerpos computacionales (N-Body), un problema popular en la comunidad HPC. A partir del trabajo experimental, fue posible determinar que Rust es un lenguaje que reduce el esfuerzo de programación, manteniendo rendimientos aceptables, posicionándolo como una posible alternativa a C para HPC.Facultad de Informátic

    Assessing Opportunities of SYCL and Intel oneAPI for Biological Sequence Alignment

    Full text link
    Background and objectives. The computational biology area is growing up over the years. The interest in researching and developing computational tools for the acquisition, storage, organization, analysis, and visualization of biological data generates the need to create new hardware architectures and new software tools that allow processing big data in acceptable times. In this sense, heterogeneous computing takes an important role in providing solutions but at the same time generates new challenges for developers in relation to the impossibility of porting source code between different architectures. Methods. Intel has recently introduced oneAPI, a new unified programming environment that allows code developed in the SYCL-based Data Parallel C++ (DPC++) language to be run on different devices such as CPUs, GPUs, and FPGAs, among others. Due to the large amount of CUDA software in the field of bioinformatics, this paper presents the migration process of the SW\# suite, a biological sequence alignment tool developed in CUDA, to DPC++ through the oneAPI compatibility tool dpc (recently renowned as SYCLomatic). Results. SW\# has been completely migrated with a small programmer intervention in terms of hand-coding. Moreover, it has been possible to port the migrated code between different architectures (considering different target platforms and vendors), with no noticeable performance degradation. Conclusions. The SYCLomatic tool presented a great performance-portability rate. SYCL and Intel oneAPI can offer attractive opportunities for the Bioinformatics community, especially considering the vast existence of CUDA-based legacy codes

    Comparing Performance and Portability between CUDA and SYCL for Protein Database Search on NVIDIA, AMD, and Intel GPUs

    Full text link
    The heterogeneous computing paradigm has led to the need for portable and efficient programming solutions that can leverage the capabilities of various hardware devices, such as NVIDIA, Intel, and AMD GPUs. This study evaluates the portability and performance of the SYCL and CUDA languages for one fundamental bioinformatics application (Smith-Waterman protein database search) across different GPU architectures, considering single and multi-GPU configurations from different vendors. The experimental work showed that, while both CUDA and SYCL versions achieve similar performance on NVIDIA devices, the latter demonstrated remarkable code portability to other GPU architectures, such as AMD and Intel. Furthermore, the architectural efficiency rates achieved on these devices were superior in 3 of the 4 cases tested. This brief study highlights the potential of SYCL as a viable solution for achieving both performance and portability in the heterogeneous computing ecosystem.Comment: This article was accepted for publication in 2023 IEEE 35th International Symposium on Computer Architecture and High Performance Computing (SBAC-PAD

    Navegación autónoma de vehículo de 4 ruedas y cuadricóptero conectados al Cloud

    Get PDF
    Esta tesina presenta el diseño, desarrollo y despliegue de un sistema Multi-Robots, compuesto por un Auto Robot que simula un vehículo tradicional, como así también, un dispositivo de vuelo capaz de capturar imágenes aéreas; ambos conectados al Cloud público de Amazon Web Services. Se detallan los prototipos desarrollados y el protocolo de comunicación utilizado; se mencionan los algoritmos implementados para el procesamiento y reconocimiento de objetos en imágenes, la simulación y planificación de caminos óptimos, junto con los métodos de transformación de los mismos y la determinación de los movimientos, con el fin de que el vehículo no tripulado pueda llegar a un destino, siguiendo únicamente directivas comandadas desde el Cloud.Facultad de Informátic

    Extracción de mujeres: la base económica del extractivismo neoliberal. El caso de Cajamarca, Perú

    Get PDF
    Esta contribución pretende demostrar que la violencia física y simbólica de género provocada por el sistema extractivista, no genera solamente un “impacto social” negativo, sino que no se puede realizar sin tal explotación, constituyendo la violencia de género la base necesaria sobre la cual el extractivismo se apoya. Utilizando una perspectiva ecofeminista, según la cual se reflexiona sobre la opresión de la mujer y de la naturaleza y denunciando en ello la mirada androcéntrica y antropocéntrica (Zuluaga Sánchez, 2015), se analizará en una primera parte el sistema neoliberal y sus mecanismos de expulsiones y extractivismo y en una segunda parte, se presentará el caso de Cajamarca (Perú), donde las empresas mineras violan sistemáticamente los derechos de las mujeres, ejerciendo un dominio violento que altera la relación entre las mujeres, su territorio y sus cuerpos, para conceptualizar como este caso demuestra un acción sistemática de los procesos extractivista

    Method for real-time measurement of the nonlinear refractive index

    Get PDF
    In this work, we propose a novel method for continuous real-time measurement of the dynamics of the nonlinear refractive index n2. This is particularly important for characterizing phenomena or materials (such as biological tissues, gases, and other compounds) whose nonlinear behavior or structure varies rapidly with time. The proposed method ingeniously employs two powerful tools: the spectral broadening induced by self-phase modulation and the real-time spectral analysis using the dispersive Fourier transformation. The feasibility of the technique is experimentally demonstrated, achieving high-speed measurements at rates of several megahertz.Fil: Fernández, Manuel Pablo. Comisión Nacional de Energía Atómica. Gerencia del Área de Energía Nuclear. Instituto Balseiro; Argentina. Comision Nacional de Energia Atomica. Gerencia D/area Invest y Aplicaciones No Nucleares. Gerencia de Des. Tec. y Proyectos Especiales. Departamento de Ingenieria En Telecomunicaciones.; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Patagonia Norte; ArgentinaFil: Bulus Rossini, Laureano Andrés. Comisión Nacional de Energía Atómica. Gerencia del Área de Energía Nuclear. Instituto Balseiro; Argentina. Comision Nacional de Energia Atomica. Gerencia D/area Invest y Aplicaciones No Nucleares. Gerencia de Des. Tec. y Proyectos Especiales. Departamento de Ingenieria En Telecomunicaciones.; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Patagonia Norte; ArgentinaFil: Costanzo Caso, Pablo Alejandro. Comisión Nacional de Energía Atómica. Gerencia del Área de Energía Nuclear. Instituto Balseiro; Argentina. Comision Nacional de Energia Atomica. Gerencia D/area Invest y Aplicaciones No Nucleares. Gerencia de Des. Tec. y Proyectos Especiales. Departamento de Ingenieria En Telecomunicaciones.; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Patagonia Norte; Argentin

    Method for real-time measurement of the nonlinear refractive index

    Get PDF
    In this work, we propose a novel method for continuous real-time measurement of the dynamics of the nonlinear refractive index n2. This is particularly important for characterizing phenomena or materials (such as biological tissues, gases and other compounds) whose nonlinear behavior or structure varies rapidly with time. The proposed method ingeniously employs two powerful tools: the spectral broadening induced by self-phase modulation and the real-time spectral analysis using the dispersive Fourier transformation. The feasibility of the technique is experimentally demonstrated, achieving high-speed measurements at rates of several MHz

    Enhanced fault characterization by using a conventional OTDR and DSP techniques

    Get PDF
    To plan a rapid response and minimize operational costs, passive optical network operators require to automatically detect and identify faults that may occur in the optical distribution network. In this work, we present DSP-Enhanced OTDR, a novel methodology for remote fault analysis based on conventional optical time-domain reflectometry complemented with reference traces and DSP-based techniques. We first obtain the optimal decision thresholds to detect deviations in the noisy OTDR measurement. In order to quantify and characterize the fault, the detection stage is followed by one of estimation where its return loss and insertion loss are determined. We experimentally demonstrate that this approach allows to detect and characterize faults with an accuracy higher than that found in conventional OTDR trace analysis. In our experiments, we achieved detection sensitivities higher than 0.2 dB in a 1:16 split-ratio PON, and higher than 1 dB in a 1:64 split-ratio PON, achieving estimation errors that can be as low as 0.01 dB. We also verified how the optical network terminal's reflectivity can improve the detection capabilities.Fil: Fernández, Manuel Pablo. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Patagonia Norte; Argentina. Comisión Nacional de Energía Atómica. Gerencia del Área de Energía Nuclear. Instituto Balseiro; Argentina. Universidad Nacional de Cuyo; ArgentinaFil: Bulus Rossini, Laureano Andrés. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Patagonia Norte; Argentina. Comisión Nacional de Energía Atómica. Gerencia del Área de Energía Nuclear. Instituto Balseiro; Argentina. Universidad Nacional de Cuyo; ArgentinaFil: Pascual, Juan Pablo. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Patagonia Norte; Argentina. Comisión Nacional de Energía Atómica. Gerencia del Área de Energía Nuclear. Instituto Balseiro; Argentina. Universidad Nacional de Cuyo; ArgentinaFil: Costanzo Caso, Pablo Alejandro. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Patagonia Norte; Argentina. Comisión Nacional de Energía Atómica. Gerencia del Área de Energía Nuclear. Instituto Balseiro; Argentina. Universidad Nacional de Cuyo; Argentin

    Brief performance portability analysis of a matrix multiplication kernel on multiple vendor GPUs

    Get PDF
    The heterogeneous computing paradigm has led to the need for portable and efficient programming solutions that can leverage the capabilities of various hardware devices, such as NVIDIA, Intel, and AMD GPUs. This study evaluates the performance and portability of the SYCL and CUDA languages for a matrix multiplication (MM) application across different GPU architectures. The experimental work showed that, while the CUDA implementation outperforms the SYCL implementation on NVIDIA devices due to optimizations provided by the nvcc compiler, the latter implementation demonstrated remarkable code portability to other GPU architectures, such as AMD and Intel. Furthermore, the architectural efficiency percentages obtained on AMD and Intel GPUs showed consistency with the results observed on NVIDIA devices.Facultad de Informátic
    corecore