10 research outputs found

    Tuning Application in a Multi-cluster Environment

    Get PDF
    Abstract. The joining of geographically distributed heterogeneous clusters of workstations through the Internet can be a simple and effective approach to speed up a parallel application execution. This paper describes a methodology to migrate a parallel application from a single-cluster to a collection of clusters, guaranteeing a minimum level of efficiency. This methodology is applied to a parallel scientific application to use three geographically scattered clusters located in Argentina, Brazil and Spain. Experimental results prove that the speedup and efficiency estimations provided by this methodology are more than 90% precision. Without the tuning process of the application a 45% of the maximum speedup is obtained whereas a 94% of that maximum speedup is attained when a tuning process is applied. In both cases efficiency is over 90%

    Could be improved the efficiency of SPMD applications on heterogeneous environments?

    Get PDF
    The goal of this work is to execute SPMD applications efficiently on heterogeneous environments. Applications used to test our work are designed with message-passing interface to communicate and are developed to be executed in a single core cluster. However, we create a methodology to execute e fficiently these SPMD applications over heterogeneous architectures. The SPMD applications are selected because they present high level of synchronism and communications; both elements could generate challenges when we want to obtain our objec- tive, which is de ned as to obtain an improvement in the execution time while maintaining the e fficiency level over a threshold defi ned by programmer, taking into consideration the communications heterogeneities present in a multicore cluster. This objective is achieved using a map-ping and scheduling strategies included in our methodology. Finally, the results obtained show an improvement around 40% in the best case of effi ciency in SPMD applications tested, when our methodology is applied.Presentado en el IX Workshop Procesamiento Distribuido y Paralelo (WPDP)Red de Universidades con Carreras en Inform谩tica (RedUNCI

    Simulaci贸n param茅trica paralela. Aplicaci贸n a modelos de predicci贸n de inundaciones.

    Get PDF
    El modelado y la simulaci贸n de inundaciones provocadas por el desborde de r铆os brinda sistemas computacionales para el estudio y la predicci贸n de estos fen贸menos naturales, con el objetivo de pronosticar su comportamiento. Estos sistemas necesitan tomar gran cantidad de datos de entrada para aumentar su precisi贸n, como tambi茅n deben generar m煤ltiples escenarios para cubrir todas las situaciones de riesgo. Por esto, son de c贸mputo intensivo y pueden tomar d铆as de procesamiento hasta lograr resultados. A este problema se le suma la falta de certeza en los valores de los datos de entrada del proceso. Mediante la programaci贸n paralela y los avances en c贸mputo de alto rendimiento en clusters de computadoras, se pretende atenuar el problema de la incertidumbre de los datos de entrada y optimizar el proceso de predicci贸n mediante la simulaci贸n de m煤ltiples escenarios. Con este trabajo se pretende desarrollar una metodolog铆a para optimizar la predicci贸n de inundaciones provocadas por el desborde de r铆os, en principio de llanuras o planicies, y en particular en la Cuenca del R铆o Salado o en el Paran谩 Medio.Eje: Procesamiento Concurrente, Paralelo y DistribuidoRed de Universidades con Carreras en Inform谩tica (RedUNCI

    Simulaci贸n param茅trica paralela. Aplicaci贸n a modelos de predicci贸n de inundaciones.

    Get PDF
    El modelado y la simulaci贸n de inundaciones provocadas por el desborde de r铆os brinda sistemas computacionales para el estudio y la predicci贸n de estos fen贸menos naturales, con el objetivo de pronosticar su comportamiento. Estos sistemas necesitan tomar gran cantidad de datos de entrada para aumentar su precisi贸n, como tambi茅n deben generar m煤ltiples escenarios para cubrir todas las situaciones de riesgo. Por esto, son de c贸mputo intensivo y pueden tomar d铆as de procesamiento hasta lograr resultados. A este problema se le suma la falta de certeza en los valores de los datos de entrada del proceso. Mediante la programaci贸n paralela y los avances en c贸mputo de alto rendimiento en clusters de computadoras, se pretende atenuar el problema de la incertidumbre de los datos de entrada y optimizar el proceso de predicci贸n mediante la simulaci贸n de m煤ltiples escenarios. Con este trabajo se pretende desarrollar una metodolog铆a para optimizar la predicci贸n de inundaciones provocadas por el desborde de r铆os, en principio de llanuras o planicies, y en particular en la Cuenca del R铆o Salado o en el Paran谩 Medio.Eje: Procesamiento Concurrente, Paralelo y DistribuidoRed de Universidades con Carreras en Inform谩tica (RedUNCI

    Could be improved the efficiency of SPMD applications on heterogeneous environments?

    Get PDF
    The goal of this work is to execute SPMD applications efficiently on heterogeneous environments. Applications used to test our work are designed with message-passing interface to communicate and are developed to be executed in a single core cluster. However, we create a methodology to execute e fficiently these SPMD applications over heterogeneous architectures. The SPMD applications are selected because they present high level of synchronism and communications; both elements could generate challenges when we want to obtain our objec- tive, which is de ned as to obtain an improvement in the execution time while maintaining the e fficiency level over a threshold defi ned by programmer, taking into consideration the communications heterogeneities present in a multicore cluster. This objective is achieved using a map-ping and scheduling strategies included in our methodology. Finally, the results obtained show an improvement around 40% in the best case of effi ciency in SPMD applications tested, when our methodology is applied.Presentado en el IX Workshop Procesamiento Distribuido y Paralelo (WPDP)Red de Universidades con Carreras en Inform谩tica (RedUNCI

    Dynamic on Demand Virtual Clusters in Grid

    Get PDF
    In Grid environments, many different resources are intended to work in a coordinated manner, each resource having its own features and complexity. As the number of resources grows, simplifying automation and management is among the most important issues to address. This paper's contribution lies on the extension and implementation of a grid metascheduler that dynamically discovers, creates and manages on-demand virtual clusters. The first module selects the clusters using graph heuristics. The algorithm then tries to find a solution by searching a set of clusters, mapped to the graph, that achieve the best performance for a given task. The second module, one per-grid node, monitors and manages physical and virtual machines. When a new task arrives, these modules modify virtual machine's configuration or use live migration to dynamically adapt resource distribution at the clusters, obtaining maximum utilization. Metascheduler components and local administrator modules work together to make decisions at run time to balance and optimize system throughput. This implementation results in performance improvement of 20% on the total computing time, with machines and clusters processing 100% of their working time. These results allow us to conclude that this solution is feasible to be implemented on Grid environments, where automation and self-management are key to attain effective resource usage.Lecture Notes in Computer Science book series (LNTCS, vol. 5415)Instituto de Investigaci贸n en Inform谩tic

    Computer Science and Technology Series : XV Argentine Congress of Computer Science. Selected papers

    Get PDF
    CACIC'09 was the fifteenth Congress in the CACIC series. It was organized by the School of Engineering of the National University of Jujuy. The Congress included 9 Workshops with 130 accepted papers, 1 main Conference, 4 invited tutorials, different meetings related with Computer Science Education (Professors, PhD students, Curricula) and an International School with 5 courses. CACIC 2009 was organized following the traditional Congress format, with 9 Workshops covering a diversity of dimensions of Computer Science Research. Each topic was supervised by a committee of three chairs of different Universities. The call for papers attracted a total of 267 submissions. An average of 2.7 review reports were collected for each paper, for a grand total of 720 review reports that involved about 300 different reviewers. A total of 130 full papers were accepted and 20 of them were selected for this book.Red de Universidades con Carreras en Inform谩tica (RedUNCI

    Simulaci贸n y optimizaci贸n como metodolog铆a para mejorar la calidad de la predicci贸n en un entorno de simulaci贸n hidrogr谩fica

    Get PDF
    El modelado y la simulaci贸n computacional de eventos naturales proveen una poderosa herramienta para comprender sus mecanismos y pronosticarlos. Estas herramientas son especialmente 煤tiles cuando estos eventos se convierten en desastres naturales que amenazan la vida humana y la econom铆a de los pueblos afectados. En particular, las inundaciones provocadas por el desborde de r铆os es uno de los desastres naturales que se benefician ampliamente con el uso de programas computacionales que ayudan a pronosticar sus efectos. Las inundaciones son fen贸menos naturales que pueden ocurrir a intervalos irregulares en cualquier riachuelo o r铆o. El asentamiento de la poblaci贸n en llanuras de inundaci贸n es la causa principal de los da帽os producidos por las inundaciones. El estudio de los procesos hidrodin谩micos en las aguas superficiales, como r铆os, ha desempe帽ado un papel pionero en el desarrollo de modelos num茅ricos para su uso en la ingenier铆a hidr谩ulica. Esto ha llevado a la producci贸n de gran cantidad de software relativamente sofisticado aplicado a estudiar y simular fen贸menos de traslaci贸n de ondas en cauces de r铆os, de manera de poder predecir eventos de desborde e inundaciones. Aunque los modelos se construyan considerando la mayor cantidad posible de variables propias del sistema simulado existen fuentes de incertidumbre en los datos de entrada y en los par谩metros propios del modelo, que aumentan el error de los datos de salida de la simulaci贸n. La mayor铆a de estos par谩metros pueden estimarse a partir de datos de campo, por ejemplo, observaciones hidrometeorol贸gicas, mapas de la topograf铆a, tipos de suelo, uso del suelo, etc. Sin embargo, rara vez est谩n disponibles datos de campo completos para apoyar plenamente la especificaci贸n de todos los par谩metros. La incertidumbre debida a los valores de los par谩metros de entrada, se debe a que no existe una manera de medirlos directamente y deben ser estimados o interpolados siendo muy dif铆cil mantener actualizados sus valores durante el per铆odo de simulaci贸n. El motivo que impuls贸 el tema central de este trabajo fue proveer a este tipo de simulaci贸n de mayor certeza en sus resultados. El objetivo principal de la tesis es brindar una metodolog铆a para mejorar la calidad de la simulaci贸n de un modelo computacional de cauce de r铆os, aplicando la t茅cnica de optimizaci贸n v铆a simulaci贸n; objetivo posible de alcanzar gracias a los aportes de las t茅cnicas y m茅todos del c贸mputo de alto rendimiento. Este m茅todo devuelve como soluci贸n un conjunto de par谩metros optimizados que mejora la predicci贸n del simulador. La mejora lograda en la calidad del simulador es medida en t茅rminos del ajuste entre los datos de salida, o simulados, y los datos reales, u observados. El desarrollo de esta tesis requiri贸 la selecci贸n de un modelo computacional de cauces. El modelo seleccionado fue el programa EZEIZA VI (Ezeiza), un modelo hidrodin谩mico desarrollado por el Instituto Nacional del Agua (INA) de la Rep煤blica Argentina, y el modelo del sistema f铆sico del r铆o Paran谩 cuyo comportamiento y evoluci贸n se simula con Ezeiza. El R铆o Paran谩 es de inter茅s para este trabajo; pertenece a la Cuenca del Plata y recorre el 谩rea m谩s poblada e industrializada de Sudam茅rica. Las conversaciones y reuniones con los investigadores del INA fueron decisivas para entender el funcionamiento del simulador Ezeiza y las caracter铆sticas del sistema simulado. De esta manera fue posible elegir los par谩metros cr铆ticos del modelo, como tambi茅n sus posibles rangos de valores. Optimizaci贸n v铆a Simulaci贸n (OvS) es un campo emergente que integra t茅cnicas de optimizaci贸n y an谩lisis de la simulaci贸n, el cual se ha convertido en una poderosa t茅cnica para el an谩lisis y optimizaci贸n de sistemas complejos. Mediante los aportes de la OvS, se implementa un metamodelo de simulaci贸n para encontrar el conjunto de par谩metros de ajuste que optimiza la salida del simulador. El uso de un metamodelo se hace para facilitar la tarea de optimizaci贸n, que implica encontrar la mejor configuraci贸n de par谩metros de entrada, o variables controlables del sistema, con el n de optimizar la funci贸n objetivo, la cual es funci贸n de las salidas del modelo de simulaci贸n, en este caso el modelo Ezeiza. El m茅todo utiliza la salida del simulador, y otros datos propios de sistema f铆sico simulado, para evaluar su funci贸n objetivo y en base a esta medida o 铆ndice de rendimiento, propone un nuevo conjunto de valores de los par谩metros. El m茅todo de OvS aplicado a mejorar los resultados del simulador Ezeiza, es un metamodelo que utiliza una estrategia de OvS en dos etapas. Un metamodelo es un modelo emp铆rico creado con datos generados por modelos computacionales, o sea son modelos de modelos. El m茅todo que se presenta se sit煤a entre los m茅todos de b煤squedas exhaustivas y las heur铆sticas propias de la optimizaci贸n y es un metamodelo que utiliza una estrategia de OvS en dos etapas. La idea principal es la siguiente: En una primera etapa, mediante un proceso iterativo, se van obteniendo subregiones del espacio de b煤squeda del problema que cumplan con su funci贸n objetivo. Esta etapa se basa en la estructura de vecindad del problema para reducir la regi贸n de posibles soluciones donde se hace la b煤squeda, mediante un esquema Monte Carlo combinado con un m茅todo K-Means. Se obtienen conjuntos de regiones prometedoras, nombradas as铆 desde el punto de vista de la posibilidad de contener la soluci贸n 贸ptima, o alguna sub贸ptima, cuyo tama帽o es mucho m谩s chico. Al finalizar, se implementa una segunda etapa de b煤squeda exhaustiva, pero ahora sobre la regi贸n prometedora resultante, ya mucho m谩s peque帽a. A pesar de la reducci贸n del espacio de b煤squeda, ambas etapas implementan m茅todos computacionales que requieren un gran tiempo de ejecuci贸n y son posibles de llevar a la pr谩ctica gracias a los recursos de programaci贸n paralela y de c贸mputo de alto rendimiento. Con estos recursos se logran tiempos de ejecuci贸n aceptables, reduciendo considerablemente el tiempo computacional de cada etapa. El m茅todo de OvS en sus dos etapas es un m茅todo f谩cilmente paralelizable. El algoritmo principal debe evaluar la funci贸n objetivo con cada candidato soluci贸n antes de ingresarlo al m茅todo de optimizaci贸n, el cual hace un an谩lisis de los 铆ndices obtenidos para decidir si el m茅todo debe repetirse. El simulador se ejecuta con cada uno de los elementos seleccionados al azar del espacio de b煤squeda por el m茅todo Monte Carlo, el cual es un espacio de 110.592 combinaciones en el primer caso de experimentaci贸n y de 19683 combinaciones en el segundo caso. Cada evaluaci贸n es independiente de las otras, por lo tanto estamos ante un problema altamente paralelizable en un cluster mediante un modelo de programaci贸n Master-Worker. La aplicaci贸n Master-Worker del m茅todo fue escrita en C++ con MPI. Se utiliz贸 pthreads para ejecutar el conjunto de programas que conforman el simulador Ezeiza, que se utilizan como una caja negra durante todo el proceso. Este trabajo optimiza la predicci贸n de Ezeiza en las estaciones de monitoreo ubicadas a lo largo del r铆o Paran谩. Para su comprobaci贸n, se implementaron dos casos de estudio del m茅todo utilizando datos reales en dos periodos de tiempo diferentes. Estos casos optimizan dos 铆ndices de rendimiento necesarios para encontrar el conjunto 贸ptimo de par谩metros. Estos 铆ndices son indicadores del rendimiento general de la simulaci贸n y dependen de los datos de salida (simulados) y de los datos observados (reales) en cada una de las 15 estaciones de monitoreo durante cada d铆a del periodo simulado. Las funciones objetivos establecidas para la optimizaci贸n est谩n definidas por estos 铆ndices. Uno de ellos minimiza el apartamiento promedio entre ambos grupos de datos y en segundo lugar se considera una funci贸n multiobjetivo que minimiza estas diferencias y maximiza la cantidad de estaciones que mejoran. Los escenarios de simulaci贸n que resultaron del proceso de OvS son los que contienen los valores 贸ptimos de sus par谩metros de entrada. Estos conjuntos soluci贸n, o conjunto de variables de decisi贸n optimizadas, junto con todos los datos de entrada de una simulaci贸n completa, constituyen los escenarios de simulaci贸n que sintonizan la predicci贸n realizada con el simulador Ezeiza. Se logr贸 una mejora en la predicci贸n de Ezeiza entre el 10% y el 25% para el primer caso de estudio y comprobaci贸n del m茅todo y mejoras entre el 20% y el 40% para el segundo caso de experimentaci贸n. Estos porcentajes representan un promedio de 40cm a 60cm de altura del agua, y la importancia de estos valores radica en que pueden ser la diferencia entre la p茅rdida o no del ganado o de cubrir casas, al entrar el agua en las planicies de inundaci贸n afectadas. Estos escenarios optimizados mejoraron favorablemente la simulaci贸n de Ezeiza en las estaciones ubicadas en el tramo del bajo Paran谩. Fue seleccionado este tramo para la optimizaci贸n, pues es un tramo del r铆o sensible para la toma de decisiones y los pron贸sticos. Esta zona tiene alto impacto en la regi贸n de la Cuenca del Plata, especialmente en su econom铆a, debido a la alta cantidad de poblaci贸n que tiene instalada en sus planicies. No es posible pensar en un escenario de optimizaci贸n de todo el sistema f铆sico, como el que representa el r铆o Paran谩 en sus 1900 km. Con 76 secciones en su cauce. En cada secci贸n se deben definir los valores de sus par谩metros ajustables. El espacio de b煤squeda resultante de la combinaci贸n de estos par谩metros toma una dimensi贸n tan inmensa, que optimizar todo el sistema es una misi贸n aun imposible de llevar a la pr谩ctica. Los resultados son alentadores y el principal aporte del trabajo fue proveer de una metodolog铆a que permiti贸 calibrar y sintonizar un simulador, como Ezeiza, de manera autom谩tica. Esto es muy beneficioso para los ingenieros hidr谩ulicos que deben hacer predicci贸n con el simulador y no pueden contar con valores actualizados constantemente de los datos del r铆o. Esta metodolog铆a es prometedora para ser utilizada en la sintonizaci贸n autom谩tica de otros simuladores hidrol贸gicos. Por otro lado, el uso del c贸mputo de alto rendimiento se potencia con el aporte del m茅todo de OvS, ya que se tiene una ganancia por la reducci贸n en cantidad de simulaciones que ofrece la metodolog铆a al reducir significativamente el espacio de b煤squeda de la soluci贸n, y la ganancia de la implementaci贸n en paralelo.Directores de la tesis: Emilio Luque Fad贸n (Universidad Aut贸noma de Barcelona) y Armando De Giusti (Universidad Nacional de La Plata).Facultad de Inform谩tic

    Planificaci贸n din谩mica sobre entornos GRID

    Get PDF
    El objetivo de esta Tesis es el an谩lisis para la gesti贸n de entornos virtuales de manera eficiente. Se realiz贸 una optimizaci贸n para el middleware de planificaci贸n en forma din谩mica sobre entornos de computaci贸n Grid, siendo la meta a alcanzar la asignaci贸n y utilizaci贸n 贸ptima de recursos para la ejecuci贸n coordinada de tareas. Se investig贸 en particular la interacci贸n entre servicios Grid y la problem谩tica de la distribuci贸n de tareas en meta-organizaciones con requerimientos de calidad de servicio no trivial, estableciendo una relaci贸n entre la distribuci贸n de tareas y las necesidades locales pertenecientes a organizaciones virtuales. En primer t茅rmino, se realizaron experiencias sobre la problem谩tica de aplicaciones en entornos multicluster y luego se analiz贸 como la infraestructura Grid pueden impactar en el dise帽o de este tipo de aplicaciones. Se propuso e implement贸 una arquitectura para la gesti贸n de entornos virtuales, logrando un m谩ximo aprovechamiento de entornos Grid utilizando clusters de computadoras como recurso. Por 煤ltimo se formul贸 una optimizaci贸n para algoritmos de planificaci贸n, donde en base a la distribuci贸n geogr谩fica y las caracter铆sticas de la aplicaci贸n que se debe ejecutar, se generan autom谩ticamente entornos virtuales de ejecuci贸n utilizando el conjunto de m谩quinas m谩s adecuado. Con esta optimizaci贸n se logra en el mejor de los casos un incremento del 20% en el tiempo total de ejecuci贸n del sistema.Es revisado por: http://sedici.unlp.edu.ar/handle/10915/9685Facultad de Inform谩tic

    Computer Science and Technology Series : XV Argentine Congress of Computer Science. Selected papers

    Get PDF
    CACIC'09 was the fifteenth Congress in the CACIC series. It was organized by the School of Engineering of the National University of Jujuy. The Congress included 9 Workshops with 130 accepted papers, 1 main Conference, 4 invited tutorials, different meetings related with Computer Science Education (Professors, PhD students, Curricula) and an International School with 5 courses. CACIC 2009 was organized following the traditional Congress format, with 9 Workshops covering a diversity of dimensions of Computer Science Research. Each topic was supervised by a committee of three chairs of different Universities. The call for papers attracted a total of 267 submissions. An average of 2.7 review reports were collected for each paper, for a grand total of 720 review reports that involved about 300 different reviewers. A total of 130 full papers were accepted and 20 of them were selected for this book.Red de Universidades con Carreras en Inform谩tica (RedUNCI
    corecore