research

TDP-Shell : entorno para acoplar gestores de colas y herramientas de monitorización

Abstract

Hoy en día la mayoría de aplicaciones distribuidas se ejecutan en clusters de ordenadores gestionados por un gestor de colas. Por otro lado, los usuarios pueden utilizar las herramientas de monitorización actuales para detectar los problemas en sus aplicaciones distribuidas. Pero para estos usuarios, es un problema utilizar estas herramientas de monitorización cuando el cluster está controlado por un gestor de colas. Este problema se debe al hecho de que los gestores de colas y las herramientas de monitorización, no gestionan adecuadamente los recursos que deben compartir al ejecutar y operar con aplicaciones distribuidas. A este problema le denominamos "falta de interoperabilidad" y para resolverlo se ha desarrollado un entorno de trabajo llamado TDP-Shell. Este entorno soporta, sin alterar sus códigos fuentes, diferentes gestores de colas, como Cóndor o SGE y diferentes herramientas de monitorización, como Paradyn, Gdb y Totalview.Nowadays distributed applications are executed on computer clusters managed by a Batch Queue Systems. Users take advantage of Monitoring Tools to detect run-time problems on their applications running on a distributed environment. But it is a challenge to use Monitoring Tools on a cluster controlled by a Batch Queue System. This is due to the fact that Batch Queue Systems and Monitoring Tools do not coordinate the management of the resources they share, when executing a distributed application. We call this problem "lack of interoperability" and to solve it we have developed a framework called TDP-Shell. This framework supports different Batch Queue Systems such as Condor and SGE, and different Monitoring Tools such as Paradyn, Gdb and Totalview, without any changes on their source code. This thesis describes the development of the TDP-Shell framework, which allows monitoring both sequential and distributed applications that are executed on a cluster controlled by a Batch Queue System, as well as a new type of monitoring called "delayed"

    Similar works