2 research outputs found

    Impact of Noise on Scaling of Collectives: An Empirical Evaluation

    Full text link
    Abstract. It is increasingly becoming evident that operating system interference in the form of daemon activity and interrupts contribute significantly to perfor-mance degradation of parallel applications in large clusters. An earlier theoretical study has evaluated the impact of system noise on application performance for different noise distributions [1]. Our work complements the theoretical analysis by presenting an empirical study of noise in production clusters. We designed a parallel benchmark that was used on large clusters at SanDeigo Supercomputing Center for collecting noise related data. This data was fed to a simulator that pre-dicts the performance of collective operations using the model of [1]. We report our comparison of the predicted and the observed performance. Additionally, the tools developed in the process have been instrumental in identifying anomalous nodes that could potentially be affecting application performance if undetected.

    Una aproximaci贸n evolutiva a la planificaci贸n en entornos HPC basada en la incorporaci贸n de criterios subjetivos

    Get PDF
    [Resumen] En el contexto de un centro de supercomputaci贸n, por muy elevados que sean los recursos, la demanda ser谩 siempre superior. Por ello, los usuarios deben realizar solicitudes para la ejecuci贸n de sus trabajos, que se ponen en espera hasta que el planificador del sistema decide pasarlos a ejecuci贸n. Pero, por desconocimiento o temor a que los trabajos sean abortados, estas solicitudes son normalmente muy imprecisas, dificultando la labor del planificador. Adem谩s, los planificadores son dif铆ciles de configurar y en todo momento asumen que una planificaci贸n dada va a satisfacer de igual manera a todos los usuarios. En este trabajo se propone un sistema de planificaci贸n que utiliza t茅cnicas de computaci贸n evolutiva para permitir la definici贸n de pol铆ticas de planificaci贸n de manera m谩s natural y estimar las necesidades reales de recursos para lograr planificaciones m谩s precisas. Adicionalmente, se considera el concepto de calidad de servicio percibida, posibilitando la incorporaci贸n de criterios subjetivos en el proceso de planificaci贸n para mantener un alto nivel de satisfacci贸n en el conjunto de usuarios y en el propio centro de supercomputaci贸n. Finalmente, se modelan diversos aspectos de los propios recursos computacionales mejorando a煤n m谩s la precisi贸n en la planificaci贸n, especialmente en sistemas heterog茅neos.[Abstract]In the context of a supercomputing center, no matter what its computational resources are, the demand will always be higher. Therefore, users must send their jobs to a queue, where they are put on hold until the scheduler decides to execute them. But, through ignorance or fear that jobs are aborted, these requests are usually very imprecise, hindering the performance of the scheduler. In addition, schedulers are difficult to configure and they assume that a given scheduling will satisfy equally to all users at all times. This thesis proposes a scheduler for high performance computing systems based on evolutionary computation techniques to allow the definition of scheduling policies more naturally and to estimate the real needs of resources in order to achieve more accurate schedules. Additionally, the concept of perceived quality of service is considered, enabling the incorporation of subjective criteria in the scheduling process to maintain a high level of satisfaction in the set of users and in the supercomputing center itself. Finally, various aspects of the computational resources are modeled to further improving accuracy in scheduling, especially in heterogeneous systems.[Resumo]No contexto dun centro de supercomputaci贸n, por moi elevados que sexan os recursos, a demanda ser谩 sempre superior. Por elo, os usuarios deben realizar solicitudes para a execuci贸n dos seus traballos, que se po帽en en espera ata que o planificador do sistema decide pasalos a execuci贸n. Pero, por desco帽ecemento ou temor a que os traballos sexan abortados, estas solicitudes son normalmente moi imprecisas, dificultando o labor do planificador. Ademais, os planificadores son dif铆ciles de configurar e en todo momento asumen que unha planificaci贸n dada vai satisfacer de igual maneira a todos os usuarios. Neste traballo proponse un sistema de planificaci贸n que utiliza t茅cnicas de computaci贸n evolutiva para permitir a definici贸n de pol铆ticas de planificaci贸n de maneira m谩is natural e estimar as necesidades reais de recursos para lograr planificaci贸ns m谩is precisas. Adicionalmente, consid茅rase o concepto de calidade de servizo percibida, posibilitando a incorporaci贸n de criterios subxectivos no proceso de planificaci贸n para manter un alto nivel de satisfacci贸n no conxunto de usuarios e no propio centro de supercomputaci贸n. Finalmente, se modelan diversos aspectos dos propios recursos computacion谩is mellorando a铆nda m谩is a precisi贸n na planificaci贸n, especialmente en sistemas heterox茅neos
    corecore