181 research outputs found
Comparación de rendimiento y esfuerzo de programación entre Rust y C en arquitecturas multicore : Caso de estudio: Simulación de N cuerpos computacionales
Históricamente, Fortran y C han sido los lenguajes de programación por defecto en la computación de alto rendimiento (High-Performance Computing, HPC). Ambos ofrecen al programador primitivas y funciones que permiten manipular la memoria del sistema e interactuar directamente con el hardware subyacente, resultando en un código eficiente tanto en tiempos de respuesta como en uso de recursos. Como contrapartida, resulta un verdadero desafío generar código que sea mantenible y escalable a lo largo del tiempo en estos tipos de lenguajes.
En el 2010 surge Rust, un nuevo lenguaje de programación diseñado para aplicaciones concurrentes y seguras, que adopta características de lenguajes procedurales, orientados a objetos y funcionales. Entre sus principios de diseño, Rust busca igualar a C en términos de eficiencia pero aumentado la seguridad y la productividad del código. Este trabajo presenta un estudio comparativo entre C y Rust en términos de rendimiento y esfuerzo de programación, seleccionando como caso de estudio la simulación de N cuerpos computacionales (N-Body), un problema popular en la comunidad HPC. A partir del trabajo experimental, fue posible determinar que Rust es un lenguaje que reduce el esfuerzo de programación, manteniendo rendimientos aceptables, posicionándolo como una posible alternativa a C para HPC.Facultad de Informátic
Assessing Opportunities of SYCL and Intel oneAPI for Biological Sequence Alignment
Background and objectives. The computational biology area is growing up over
the years. The interest in researching and developing computational tools for
the acquisition, storage, organization, analysis, and visualization of
biological data generates the need to create new hardware architectures and new
software tools that allow processing big data in acceptable times. In this
sense, heterogeneous computing takes an important role in providing solutions
but at the same time generates new challenges for developers in relation to the
impossibility of porting source code between different architectures.
Methods. Intel has recently introduced oneAPI, a new unified programming
environment that allows code developed in the SYCL-based Data Parallel C++
(DPC++) language to be run on different devices such as CPUs, GPUs, and FPGAs,
among others. Due to the large amount of CUDA software in the field of
bioinformatics, this paper presents the migration process of the SW\# suite, a
biological sequence alignment tool developed in CUDA, to DPC++ through the
oneAPI compatibility tool dpc (recently renowned as SYCLomatic).
Results. SW\# has been completely migrated with a small programmer
intervention in terms of hand-coding. Moreover, it has been possible to port
the migrated code between different architectures (considering different target
platforms and vendors), with no noticeable performance degradation.
Conclusions. The SYCLomatic tool presented a great performance-portability
rate. SYCL and Intel oneAPI can offer attractive opportunities for the
Bioinformatics community, especially considering the vast existence of
CUDA-based legacy codes
Comparing Performance and Portability between CUDA and SYCL for Protein Database Search on NVIDIA, AMD, and Intel GPUs
The heterogeneous computing paradigm has led to the need for portable and
efficient programming solutions that can leverage the capabilities of various
hardware devices, such as NVIDIA, Intel, and AMD GPUs. This study evaluates the
portability and performance of the SYCL and CUDA languages for one fundamental
bioinformatics application (Smith-Waterman protein database search) across
different GPU architectures, considering single and multi-GPU configurations
from different vendors. The experimental work showed that, while both CUDA and
SYCL versions achieve similar performance on NVIDIA devices, the latter
demonstrated remarkable code portability to other GPU architectures, such as
AMD and Intel. Furthermore, the architectural efficiency rates achieved on
these devices were superior in 3 of the 4 cases tested. This brief study
highlights the potential of SYCL as a viable solution for achieving both
performance and portability in the heterogeneous computing ecosystem.Comment: This article was accepted for publication in 2023 IEEE 35th
International Symposium on Computer Architecture and High Performance
Computing (SBAC-PAD
Navegación autónoma de vehículo de 4 ruedas y cuadricóptero conectados al Cloud
Esta tesina presenta el diseño, desarrollo y despliegue de un sistema Multi-Robots, compuesto por un Auto Robot que simula un vehículo tradicional, como así también, un dispositivo de vuelo capaz de capturar imágenes aéreas; ambos conectados al Cloud público de Amazon Web Services. Se detallan los prototipos desarrollados y el protocolo de comunicación utilizado; se mencionan los algoritmos implementados para el procesamiento y reconocimiento de objetos en imágenes, la simulación y planificación de caminos óptimos, junto con los métodos de transformación de los mismos y la determinación de los movimientos, con el fin de que el vehículo no tripulado pueda llegar a un destino, siguiendo únicamente directivas comandadas desde el Cloud.Facultad de Informátic
Extracción de mujeres: la base económica del extractivismo neoliberal. El caso de Cajamarca, Perú
Esta contribución pretende demostrar que la violencia física y simbólica de
género provocada por el sistema extractivista, no genera solamente un
“impacto social” negativo, sino que no se puede realizar sin tal explotación,
constituyendo la violencia de género la base necesaria sobre la cual el
extractivismo se apoya.
Utilizando una perspectiva ecofeminista, según la cual se reflexiona sobre la
opresión de la mujer y de la naturaleza y denunciando en ello la mirada
androcéntrica y antropocéntrica (Zuluaga Sánchez, 2015), se analizará en una
primera parte el sistema neoliberal y sus mecanismos de expulsiones y
extractivismo y en una segunda parte, se presentará el caso de Cajamarca
(Perú), donde las empresas mineras violan sistemáticamente los derechos de
las mujeres, ejerciendo un dominio violento que altera la relación entre las
mujeres, su territorio y sus cuerpos, para conceptualizar como este caso
demuestra un acción sistemática de los procesos extractivista
Method for real-time measurement of the nonlinear refractive index
In this work, we propose a novel method for continuous real-time measurement of the dynamics of the nonlinear refractive index n2. This is particularly important for characterizing phenomena or materials (such as biological tissues, gases, and other compounds) whose nonlinear behavior or structure varies rapidly with time. The proposed method ingeniously employs two powerful tools: the spectral broadening induced by self-phase modulation and the real-time spectral analysis using the dispersive Fourier transformation. The feasibility of the technique is experimentally demonstrated, achieving high-speed measurements at rates of several megahertz.Fil: Fernández, Manuel Pablo. Comisión Nacional de Energía Atómica. Gerencia del Área de Energía Nuclear. Instituto Balseiro; Argentina. Comision Nacional de Energia Atomica. Gerencia D/area Invest y Aplicaciones No Nucleares. Gerencia de Des. Tec. y Proyectos Especiales. Departamento de Ingenieria En Telecomunicaciones.; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Patagonia Norte; ArgentinaFil: Bulus Rossini, Laureano Andrés. Comisión Nacional de Energía Atómica. Gerencia del Área de Energía Nuclear. Instituto Balseiro; Argentina. Comision Nacional de Energia Atomica. Gerencia D/area Invest y Aplicaciones No Nucleares. Gerencia de Des. Tec. y Proyectos Especiales. Departamento de Ingenieria En Telecomunicaciones.; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Patagonia Norte; ArgentinaFil: Costanzo Caso, Pablo Alejandro. Comisión Nacional de Energía Atómica. Gerencia del Área de Energía Nuclear. Instituto Balseiro; Argentina. Comision Nacional de Energia Atomica. Gerencia D/area Invest y Aplicaciones No Nucleares. Gerencia de Des. Tec. y Proyectos Especiales. Departamento de Ingenieria En Telecomunicaciones.; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Patagonia Norte; Argentin
Method for real-time measurement of the nonlinear refractive index
In this work, we propose a novel method for continuous real-time measurement
of the dynamics of the nonlinear refractive index n2. This is particularly
important for characterizing phenomena or materials (such as biological
tissues, gases and other compounds) whose nonlinear behavior or structure
varies rapidly with time. The proposed method ingeniously employs two powerful
tools: the spectral broadening induced by self-phase modulation and the
real-time spectral analysis using the dispersive Fourier transformation. The
feasibility of the technique is experimentally demonstrated, achieving
high-speed measurements at rates of several MHz
Enhanced fault characterization by using a conventional OTDR and DSP techniques
To plan a rapid response and minimize operational costs, passive optical network operators require to automatically detect and identify faults that may occur in the optical distribution network. In this work, we present DSP-Enhanced OTDR, a novel methodology for remote fault analysis based on conventional optical time-domain reflectometry complemented with reference traces and DSP-based techniques. We first obtain the optimal decision thresholds to detect deviations in the noisy OTDR measurement. In order to quantify and characterize the fault, the detection stage is followed by one of estimation where its return loss and insertion loss are determined. We experimentally demonstrate that this approach allows to detect and characterize faults with an accuracy higher than that found in conventional OTDR trace analysis. In our experiments, we achieved detection sensitivities higher than 0.2 dB in a 1:16 split-ratio PON, and higher than 1 dB in a 1:64 split-ratio PON, achieving estimation errors that can be as low as 0.01 dB. We also verified how the optical network terminal's reflectivity can improve the detection capabilities.Fil: Fernández, Manuel Pablo. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Patagonia Norte; Argentina. Comisión Nacional de Energía Atómica. Gerencia del Área de Energía Nuclear. Instituto Balseiro; Argentina. Universidad Nacional de Cuyo; ArgentinaFil: Bulus Rossini, Laureano Andrés. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Patagonia Norte; Argentina. Comisión Nacional de Energía Atómica. Gerencia del Área de Energía Nuclear. Instituto Balseiro; Argentina. Universidad Nacional de Cuyo; ArgentinaFil: Pascual, Juan Pablo. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Patagonia Norte; Argentina. Comisión Nacional de Energía Atómica. Gerencia del Área de Energía Nuclear. Instituto Balseiro; Argentina. Universidad Nacional de Cuyo; ArgentinaFil: Costanzo Caso, Pablo Alejandro. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Patagonia Norte; Argentina. Comisión Nacional de Energía Atómica. Gerencia del Área de Energía Nuclear. Instituto Balseiro; Argentina. Universidad Nacional de Cuyo; Argentin
Brief performance portability analysis of a matrix multiplication kernel on multiple vendor GPUs
The heterogeneous computing paradigm has led to the need for portable and efficient programming solutions that can leverage the capabilities of various hardware devices, such as NVIDIA, Intel, and AMD GPUs. This study evaluates the performance and portability of the SYCL and CUDA languages for a matrix multiplication (MM) application across different GPU architectures. The experimental work showed that, while the CUDA implementation outperforms the SYCL implementation on NVIDIA devices due to optimizations provided by the nvcc compiler, the latter implementation demonstrated remarkable code portability to other GPU architectures, such as AMD and Intel. Furthermore, the architectural efficiency percentages obtained on AMD and Intel GPUs showed consistency with the results observed on NVIDIA devices.Facultad de Informátic
- …