1 research outputs found

    Integraci贸n din谩mica de entornos de computaci贸n heterog茅neos para la ejecuci贸n de workflows cient铆ficos

    Get PDF
    Los workflows cient铆ficos se caracterizan por estar compuestos por un elevado n煤mero de tareas computacionalmente muy costosas. Las necesidades planteadas por este tipo de workflow hacen necesaria la utilizaci贸n de entornos de computaci贸n capaces de satisfacer estos requisitos de computaci贸n. En este contexto, la computaci贸n Grid ha emergido como un paradigma adecuado para la ejecuci贸n de workflows cient铆ficos gracias a la capacidad computacional y las comunicaciones en red de estos entornos. No obstante, esta nueva "sociedad" compuesta por Grids y workflows cient铆ficos todav铆a mantiene abiertos un amplio abanico de retos y dificultades. La posibilidad de ejecutar workflows programados en diferentes lenguajes sobre un mismo entorno de computaci贸n, la integraci贸n de entornos de computaci贸n heterog茅neos bajo una misma infraestructura, y la posibilidad de ejecutar diferentes partes de un mismo workflow en diferentes entornos de computaci贸n son algunos de los principales problemas existentes. Como primer paso para la resoluci贸n de estos problemas, se desarroll贸 una infraestructura que integra diferentes entornos de computaci贸n heterog茅neos de forma transparente para el usuario y que permite ejecutar workflows programados en diversos lenguajes ampliamente aceptados por la comunidad cient铆fica. De esta forma, se proporcion贸 una infraestructura capaz de solucionar los retos anteriores. Un aspecto ortogonal a estos retos no considerado en la infraestructura propuesta es el proceso de asignaci贸n de tareas a los recursos disponibles en los diferentes entornos integrados (meta-scheduling). Este proceso es clave para la definici贸n de soluciones maduras y completas a los problemas expuestos. Para avanzar en el desarrollo de la soluci贸n propuesta y mejorar la infraestructura, en esta Tesis Fin de M谩ster se propone una estrategia de meta-scheduling basada en t茅cnicas de simulaci贸n que permite asignar din谩micamente el entorno de ejecuci贸n a utilizar en cada una de las tareas de un workflow. Para ello, se ha integrado en la infraestructura un meta-scheduler que, para cada tarea, selecciona el entorno de ejecuci贸n m谩s adecuado utilizando un algoritmo de optimizaci贸n del tiempo de ejecuci贸n. La informaci贸n utilizada para esta toma de decisiones proviene de los resultados de simular la ejecuci贸n de las tareas en los entornos de computaci贸n disponibles. Para soportar este proceso, se ha dise帽ado un simulador gen茅rico, adaptable y extensible basado en Alea. Para cada entorno de computaci贸n, una instancia de este simulador ha sido customizada e integrada en la infraestructura. Asimismo, se ha definido una metodolog铆a para la creaci贸n de workloads din谩micos que permite simular las tareas en condiciones reales de carga. El uso de estos workloads y el propio dise帽o de los simuladores, capaces de capturar la complejidad inherente de los entornos de computaci贸n, han permitido obtener un elevado grado de precisi贸n en las simulaciones, tal y como se ha demostrado en la validaci贸n experimental realizada. Como consecuencia, se ha conseguido mejorar el rendimiento de los workflows ejecutados. Finalmente, la viabilidad y beneficios de la soluci贸n propuesta se muestran mediante su aplicaci贸n a un workflow real en el dominio de la computaci贸n cient铆fica, el workflow de an谩lisis Inspiral. Para este caso de uso, la utilizaci贸n de la infraestructura con la estrategia de meta-scheduling propuesta ha permitido obtener una mejora del rendimiento de un 59% respecto a la ejecuci贸n del workflow completo en el cluster Hermes del I3A y una mejora de un 111% respecto a la ejecuci贸n del workflow en el Grid AraGrid
    corecore