65 research outputs found

    Choosing between remote I/O versus staging in distributed environments

    Get PDF
    Today, scientifi_x000C_c applications and experiments have become increasingly complex and more demanding in terms of their computational and data requirements. The amount of data generated and used has grown at a very rapid rate. As tens or hundreds of terabytes of data for a single application is very common today; petabytes and even exabytes of data will be very common in a few years. One of the major challenges in distributed computing environments is how to access these large datasets remotely over the network. Data staging and remote I/O are the most widely used data access methods for distributed applications. Application developers generally chose one over the other intuitively without making any scienti_x000C_fic comparison specifi_x000C_c to their applications since there is no generic model available that they can use. In this thesis, we develop generic models and set guidelines for the application developers which would help them to choose the most appropriate data access method for their application. We de_x000C_fine the parameters that potentially aff_x000B_ect the end-to-end performance of the distributed applications which need to access remote data. To achieve our goal, we implement a series of synthetic benchmark applications to simulate di_x000B_fferent data access patterns. We run these benchmark applications on diff_x000B_erent distributed computing settings with di_x000B_fferent parameters, such as network bandwidth, server and client capabilities, and data access ratio. We also use di_x000B_fferent remote I/O protocols to show the importance of the protocol in making a decision. We use regression analysis to develop applicable generic models for comparing diff_x000B_erent data access methods, and test our models in a real life application. The main contribution of our thesis is generic models that can be applied to most data-intensive distributed applications to decide the best data access technique for those applications. Our models provide the scientists and application developers an opportunity to choose the best data access method before actually running the application

    Interim research assessment 2003-2005 - Computer Science

    Get PDF
    This report primarily serves as a source of information for the 2007 Interim Research Assessment Committee for Computer Science at the three technical universities in the Netherlands. The report also provides information for others interested in our research activities

    A study on the deployment of GA in a grid computing framework

    Get PDF
    Dissertação de Mestrado, Engenharia InformĂĄtica, Faculdade de CiĂȘncias e Tecnologia, Universidade do Algarve, 2015Os algoritmos genĂ©ticos (AG) desempenham um papel importante na resolução de muitos problemas de otimização, incluindo cientĂ­ficos, econĂłmicos e socialmente relevantes. Os AGs, conjuntamente com a programação genĂ©tica (PG), a programação evolutiva (PE), e as estratĂ©gias de evolução, sĂŁo as principais classes de algoritmos evolutivos (AEs), ou seja, algoritmos que simulam a evolução natural. Em aplicaçÔes do mundo real o tempo de execução dos AGs pode ser computacionalmente exigente, devido, principalmente, aos requerimentos relacionados com o tamanho da população. Este problema pode ser atenuado atravĂ©s da paralelização, que pode levar a GAs mais rĂĄpidos e com melhor desempenho. Embora a maioria das implementaçÔes existentes de Algoritmos GenĂ©ticos Paralelos (AGPs) utilize clusters ou processamento massivamente paralelo (PMP), a computação em grid Ă© economicamente relevante (uma grid pode ser construĂ­da utilizando computadores obsoletos) e tem algumas vantagens sobre os clusters, como por exemplo a nĂŁo existĂȘncia de controlo centralizado, segurança e acesso a recursos heterogĂ©neos distribuĂ­dos em organizaçÔes virtuais dinĂąmicas em todo o mundo. Esta investigação utiliza o problema do mundo real denominado de Problema do Caixeiro Viajante (PCV) como referĂȘncia (benchmark) para a paralelização de AGs numa infraestrutura de computação em grid. O PCV Ă© um problema NP-difĂ­cil de otimização combinatĂłria, bem conhecido, que pode ser formalmente descrito como o problema de encontrar, num grafo, o ciclo hamiltoniano mais curto. De facto, muitos problemas de roteamento, produção e escalonamento encontrados na engenharia, na indĂșstria e outros tipos de negĂłcio, podem ser equiparados ao PCV, daĂ­ a sua importĂąncia. Informalmente, o problema pode ser descrito da seguinte forma: Um vendedor tem um grande nĂșmero de cidades para visitar e precisa encontrar o caminho mais curto para visitar todas as cidades, sem revisitar nenhuma delas. A principal dificuldade em encontrar as melhores soluçÔes para o PCV Ă© o grande nĂșmero de caminhos possĂ­veis; (n-1)! / 2 para um caminho de n cidades simĂ©tricas. À medida que o nĂșmero de cidades aumenta, o nĂșmero de caminhos possĂ­veis tambĂ©m aumenta de uma forma fatorial. O PCV Ă©, portanto, computacionalmente intratĂĄvel, justificando plenamente a utilização de um mĂ©todo de otimização estocĂĄstica, como os AGs. No entanto, mesmo um algoritmo de otimização estocĂĄstica pode demorar demasiado tempo para calcular, Ă  medida que o tamanho do problema aumenta. Num AG para grandes populaçÔes, o tempo necessĂĄrio para resolver o problema pode atĂ© ser excessivamente longo. Uma forma de acelerar tais algoritmos Ă© usar recursos adicionais, tais como elementos adicionais de processamento funcionando em paralelo e colaborando para encontrar a solução. Isto leva a implementaçÔes simultĂąneas de AGs, adequadas para a implementação em recursos colaborando em paralelo e/ou de forma distribuĂ­da. Os Algoritmos evolutivos paralelos (AEPs) destinam-se a implementar algoritmos mais rĂĄpidos e com melhor desempenho, usando populaçÔes estruturadas, ou seja, distribuiçÔes espaciais dos indivĂ­duos. Uma das maneiras possĂ­veis de descentralizar a população Ă© distribuĂ­-la por um conjunto de nĂłs de processamento (ilhas) que trocam periodicamente (migram) potenciais soluçÔes; o chamado modelo de ilhas. O modelo de ilhas permite um nĂșmero considerĂĄvel de topologias de migração e, pela Informação que foi possĂ­vel apurar, hĂĄ uma carĂȘncia de trabalhos de investigação sobre a comparação dessas topologias de migração, ao implementar AEPs em infraestruturas de computação em grid. De facto, a comparação de topologias de migração, utilizando uma infraestrutura de computação em grid, como proposto neste trabalho, parece nĂŁo estar disponĂ­vel na literatura. Esta comparação tem como objetivo fornecer uma resposta tecnicamente sĂłlida para a questĂŁo de investigação: Qual Ă© a topologia, de modelo de ilhas, mais rĂĄpida para resolver instĂąncias do PCV usando um algoritmo genĂ©tico baseado em ordem, num ambiente de computação em grid, heterogĂ©neo e distribuĂ­do, sem uma perda significativa de fitness, comparativamente com a implementação sequencial e panmĂ­tica do mesmo algoritmo? Uma hipĂłtese para responder Ă  questĂŁo de investigação pode ser expressa da seguinte forma: Para resolver instĂąncias TSP, usando um algoritmo genĂ©tico baseado em ordem, num ambiente de computação em grid, heterogĂ©neo e distribuĂ­do, sem uma perda significativa de fitness, comparativamente com a implementação sequencial e panmĂ­tica do mesmo algoritmo, escolha qualquer uma das topologias coordenadas do modelo de ilhas, de entre as topologias testadas (estrela, roda, ĂĄrvore, matriz totalmente conectada, ĂĄrvore-anel, anel) com o maior nĂșmero de nĂłs possĂ­vel (mesmo os mais lentos) e selecione a frequĂȘncia de migração g que otimiza o tempo de execução para a topologia escolhida. A metodologia de investigação Ă© essencialmente experimental, observando e analisando o comportamento do algoritmo ao alterar as propriedades do modelo de ilhas. Os resultados mostram que o AG Ă© acelerado quando implementado num ambiente grid, mantendo a qualidade dos resultados obtidos na versĂŁo sequencial. AlĂ©m disso, mesmo os computadores obsoletos podem ser usados como nĂłs contribuindo para acelerar o tempo de execução do algoritmo. Este trabalho tambĂ©m discute a adequação de uma abordagem assĂ­ncrona para a implementação do AG num ambiente de computação em grid

    A study on the deployment of GA in a grid computing framework

    Get PDF
    Dissertação de Mestrado, Engenharia InformĂĄtica, Faculdade de CiĂȘncias e Tecnologia, Universidade do Algarve, 2015Os algoritmos genĂ©ticos (AG) desempenham um papel importante na resolução de muitos problemas de otimização, incluindo cientĂ­ficos, econĂłmicos e socialmente relevantes. Os AGs, conjuntamente com a programação genĂ©tica (PG), a programação evolutiva (PE), e as estratĂ©gias de evolução, sĂŁo as principais classes de algoritmos evolutivos (AEs), ou seja, algoritmos que simulam a evolução natural. Em aplicaçÔes do mundo real o tempo de execução dos AGs pode ser computacionalmente exigente, devido, principalmente, aos requerimentos relacionados com o tamanho da população. Este problema pode ser atenuado atravĂ©s da paralelização, que pode levar a GAs mais rĂĄpidos e com melhor desempenho. Embora a maioria das implementaçÔes existentes de Algoritmos GenĂ©ticos Paralelos (AGPs) utilize clusters ou processamento massivamente paralelo (PMP), a computação em grid Ă© economicamente relevante (uma grid pode ser construĂ­da utilizando computadores obsoletos) e tem algumas vantagens sobre os clusters, como por exemplo a nĂŁo existĂȘncia de controlo centralizado, segurança e acesso a recursos heterogĂ©neos distribuĂ­dos em organizaçÔes virtuais dinĂąmicas em todo o mundo. Esta investigação utiliza o problema do mundo real denominado de Problema do Caixeiro Viajante (PCV) como referĂȘncia (benchmark) para a paralelização de AGs numa infraestrutura de computação em grid. O PCV Ă© um problema NP-difĂ­cil de otimização combinatĂłria, bem conhecido, que pode ser formalmente descrito como o problema de encontrar, num grafo, o ciclo hamiltoniano mais curto. De facto, muitos problemas de roteamento, produção e escalonamento encontrados na engenharia, na indĂșstria e outros tipos de negĂłcio, podem ser equiparados ao PCV, daĂ­ a sua importĂąncia. Informalmente, o problema pode ser descrito da seguinte forma: Um vendedor tem um grande nĂșmero de cidades para visitar e precisa encontrar o caminho mais curto para visitar todas as cidades, sem revisitar nenhuma delas. A principal dificuldade em encontrar as melhores soluçÔes para o PCV Ă© o grande nĂșmero de caminhos possĂ­veis; (n-1)! / 2 para um caminho de n cidades simĂ©tricas. À medida que o nĂșmero de cidades aumenta, o nĂșmero de caminhos possĂ­veis tambĂ©m aumenta de uma forma fatorial. O PCV Ă©, portanto, computacionalmente intratĂĄvel, justificando plenamente a utilização de um mĂ©todo de otimização estocĂĄstica, como os AGs. No entanto, mesmo um algoritmo de otimização estocĂĄstica pode demorar demasiado tempo para calcular, Ă  medida que o tamanho do problema aumenta. Num AG para grandes populaçÔes, o tempo necessĂĄrio para resolver o problema pode atĂ© ser excessivamente longo. Uma forma de acelerar tais algoritmos Ă© usar recursos adicionais, tais como elementos adicionais de processamento funcionando em paralelo e colaborando para encontrar a solução. Isto leva a implementaçÔes simultĂąneas de AGs, adequadas para a implementação em recursos colaborando em paralelo e/ou de forma distribuĂ­da. Os Algoritmos evolutivos paralelos (AEPs) destinam-se a implementar algoritmos mais rĂĄpidos e com melhor desempenho, usando populaçÔes estruturadas, ou seja, distribuiçÔes espaciais dos indivĂ­duos. Uma das maneiras possĂ­veis de descentralizar a população Ă© distribuĂ­-la por um conjunto de nĂłs de processamento (ilhas) que trocam periodicamente (migram) potenciais soluçÔes; o chamado modelo de ilhas. O modelo de ilhas permite um nĂșmero considerĂĄvel de topologias de migração e, pela Informação que foi possĂ­vel apurar, hĂĄ uma carĂȘncia de trabalhos de investigação sobre a comparação dessas topologias de migração, ao implementar AEPs em infraestruturas de computação em grid. De facto, a comparação de topologias de migração, utilizando uma infraestrutura de computação em grid, como proposto neste trabalho, parece nĂŁo estar disponĂ­vel na literatura. Esta comparação tem como objetivo fornecer uma resposta tecnicamente sĂłlida para a questĂŁo de investigação: Qual Ă© a topologia, de modelo de ilhas, mais rĂĄpida para resolver instĂąncias do PCV usando um algoritmo genĂ©tico baseado em ordem, num ambiente de computação em grid, heterogĂ©neo e distribuĂ­do, sem uma perda significativa de fitness, comparativamente com a implementação sequencial e panmĂ­tica do mesmo algoritmo? Uma hipĂłtese para responder Ă  questĂŁo de investigação pode ser expressa da seguinte forma: Para resolver instĂąncias TSP, usando um algoritmo genĂ©tico baseado em ordem, num ambiente de computação em grid, heterogĂ©neo e distribuĂ­do, sem uma perda significativa de fitness, comparativamente com a implementação sequencial e panmĂ­tica do mesmo algoritmo, escolha qualquer uma das topologias coordenadas do modelo de ilhas, de entre as topologias testadas (estrela, roda, ĂĄrvore, matriz totalmente conectada, ĂĄrvore-anel, anel) com o maior nĂșmero de nĂłs possĂ­vel (mesmo os mais lentos) e selecione a frequĂȘncia de migração g que otimiza o tempo de execução para a topologia escolhida. A metodologia de investigação Ă© essencialmente experimental, observando e analisando o comportamento do algoritmo ao alterar as propriedades do modelo de ilhas. Os resultados mostram que o AG Ă© acelerado quando implementado num ambiente grid, mantendo a qualidade dos resultados obtidos na versĂŁo sequencial. AlĂ©m disso, mesmo os computadores obsoletos podem ser usados como nĂłs contribuindo para acelerar o tempo de execução do algoritmo. Este trabalho tambĂ©m discute a adequação de uma abordagem assĂ­ncrona para a implementação do AG num ambiente de computação em grid

    Wireless remote patient monitoring on general hospital wards.

    Get PDF
    A novel approach which has potential to improve quality of patient care on general hospital wards is proposed. Patient care is a labour-intensive task that requires high input of human resources. A Remote Patient Monitoring (RPM) system is proposed which can go some way towards improving patient monitoring on general hospital wards. In this system vital signs are gathered from patients and sent to a control unit for centralized monitoring. The RPM system can complement the role of nurses in monitoring patients’ vital signs. They will be able to focus on holistic needs of patients thereby providing better personal care. Wireless network technologies, ZigBee and Wi-Fi, are utilized for transmission of vital signs in the proposed RPM system. They provide flexibility and mobility to patients. A prototype system for RPM is designed and simulated. The results illustrated the capability, suitability and limitation of the chosen technology

    Contributions aux systÚmes répartis en environnements ubiquitaires : adaptation, sensibilité au contexte et tolérance aux fautes

    Get PDF
    D'annĂ©es en annĂ©es, nous observons l'arrivĂ©e sur le marche d'ordinateurs personnels de plus en plus petits pour des utilisateurs de plus en plus nombreux, ainsi des assistants personnels numĂ©riques et des objets dits connectĂ©s, en passant par les tĂ©lĂ©phones mobiles. Tous ces dispositifs tendent Ă  ĂȘtre interchangeables du point de vue des ressources en mĂ©moire, en calcul et en connectivitĂ© : par exemple, les tĂ©lĂ©phones mobiles sont devenus des Ă©quipements informatiques de moins en moins spĂ©cialisĂ©s ou de plus en plus universels et font dorĂ©navant office en la matiĂšre de portails d'accĂšs aux capteurs prĂ©sents dans l'environnement immĂ©diat de l'utilisateur. L'enjeu abordĂ© dans nos travaux est la construction de systĂšmes rĂ©partis incluant ces nouveaux dispositifs matĂ©riels. L'objectif de mes recherches est la conception des paradigmes d'intermĂ©diation gĂ©nĂ©riques sous-jacents aux applications rĂ©parties de plus en plus ubiquitaires. Plus particuliĂšrement, la problĂ©matique gĂ©nĂ©rale de mes travaux est la dĂ©finition du rĂŽle des intergiciels dans l'intĂ©gration des dispositifs mobiles et des objets connectĂ©s dans les architectures logicielles rĂ©parties. Ces architectures logicielles reposaient trĂšs majoritairement sur des infrastructures logicielles fixes au dĂ©but des travaux prĂ©sentĂ©s dans ce manuscrit. Dans ce manuscrit, je dĂ©cris mes travaux sur trois sujets : 1) l'adaptation des applications rĂ©parties pour la continuitĂ© de service pendant les dĂ©connexions, 2) la gestion des informations du contexte d'exĂ©cution des applications rĂ©parties pour leur sensibilitĂ© au contexte, et 3) les mĂ©canismes de dĂ©tection des entraves dans les environnements fortement dynamiques tels que ceux construits avec des rĂ©seaux mobiles spontanĂ©s. Sur le premier sujet, nous fournissons une couche intergicielle gĂ©nĂ©rique pour la gestion des aspects rĂ©partis de la gestion des dĂ©connexions en utilisant une stratĂ©gie d'adaptation collaborative dans les architectures Ă  base d'objets et de composants. Sur le deuxiĂšme sujet, nous Ă©tudions les paradigmes architecturaux pour la construction d'un service de gestion de contexte gĂ©nĂ©rique, afin d'adresser la diversitĂ© des traitements (fusion et agrĂ©gation, corrĂ©lation, dĂ©tection de situation par apprentissage, etc.), puis nous adressons le problĂšme de la distribution des informations de contexte aux diffĂ©rentes Ă©chelles de l'Internet des objets. Enfin, sur le troisiĂšme sujet, nous commençons par la dĂ©tection des modes de fonctionnement pour l'adaptation aux dĂ©connexions afin de faire la diffĂ©rence, lorsque cela est possible, entre une dĂ©connexion et une dĂ©faillance, et ensuite nous spĂ©cifions et construisons un service de gestion de groupe partitionnable. Ce service est assez fort pour interdire la construction de partitions ne correspondant pas Ă  la rĂ©alitĂ© de l'environnement Ă  un instant donnĂ© et est assez faible pour ĂȘtre mis en oeuvre algorithmiquemen
    • 

    corecore