Cada día crece máis a demanda de recursos de computación requirida polos investigadores,
capacidades de cálculo que coexisten co crecente volume de datos xerado actualmente. Estes
investigadores están a demandar un servizo de Computación de Altas Prestacións (HPC) que
permita a execución das suas simulacións dunha forma na que se deslocalicen os recursos para
poder acceder aos máximos posibles, facilitandoo coa forma o máis cómoda e segura para eles.
Doutra banda, as universidades están conectadas con centros de investigación con redes que
pusuen unha velocidade e fiabilidade que posibilitan a execución de traballos de cálculo
científico. As capacidades de computo existentes en universidades van dende aulas informáticas
para usos docentes, laboratorios, etc., ata clusters de ordenadores pertencentes a grupos de
investigación. Usando tecnoloxías grid e cloud estes recursos computacionais heteroxéneos
poderían ser reutilizados polos investigadores para realizar simulacións, aportando unha maior
cantidade de cómputo a xa existente e deslocalizando os recursos entre distintos lugares ao
redor do planeta. O obxectivo desta tese é adaptar a contorna para computación distribuída
DIRAC, desenvolvida para o proxecto LHCb do CERN, para o seu uso por varias comunidades de
usuarios baseado nas tecnoloxías cloud e big data. Esta contorna pusuiría repositorios de
software centralizados que permitan proveer o software necesario para que a través dos
entornos na nube se poidan executar as aplicacións dos investigadores en calquera parte do
planeta dunha forma escalable, permitindo aprobeitar tanto recursos dedicados como nondedicados.
Avaliando así a execución desta plataforma para a realización de cálculos científicos.
Este traballo comezará coa obtención de requisitos, para pasar despois ao proceso de
integración básica. Posteriormente, optimizarase o uso do software cientifico empregado para as
contornas cloud, tratando de adaptalo aos entornos virtualizados. Para iso, será necesario
realizar un estudo estadístico que sexa o máis próximo posible aos entornos en producción para
poder determinar e crear as infraestructuras adaptadas evitando así a perda de rendemento
dentro de recursos. O seguinte caso sería utilizar as tecnoloxías virtualizadas, adaptando as
arquitecturas creadas, para a creación de sistemas que permitan o envío de traballos que
requiran de grandes cantidades de datos no eido do big data dunha forma distribuida