thesis

Data Warehouses suportados por Nuvens

Abstract

Dissertação de mestrado em Engenharia InformáticaO universo das Tecnologias de Informação está a assistir a grandes mudanças desde o surgimento do conceito de cloud computing. A cloud computing revela-se como um meio que possibilita a fácil aquisição e liberação (elasticidade) de recursos computacionais, que disponibiliza infraestruturas altamente escaláveis e dispendiosas com o mínimo de configuração possível e, ainda, pelo facto de ser um serviço com custos reduzidos comparativamente a uma solução in-house, pois tipicamente utiliza um modelo “pay-as-you-go”. Claro que com a delegação de toda a infraestrutura e dos dados para um provedor de clouds, questões como a segurança e privacidade dos dados começaram a ser equacionadas, apresentando-se assim como desvantagens para soluções em cloud. No entanto, além da cloud computing, outras variáveis, como o grande aumento do volume de dados nas empresas e os avanços tecnológicos alcançados nas redes de banda larga, têm “exigido” a adaptação das bases de dados para um ambiente em cloud, o que originou, pouco a pouco, o paradigma de Database as a Service. Atualmente ainda existem dúvidas relativamente às bases de dados SQL, sobre se estas serão as mais indicadas para ambientes cloud. Este modelo de bases de dados tem dominado o mercado mas apresenta diversas limitações (por exemplo a nível de escalabilidade e garantia das propriedades ACID) quando confrontadas com implementações num ambiente cloud. Por outro lado, o ecossistema de aplicações desenvolvidas com bases de dados SQL é demasiado grande para ser modificado para outro modelo. Apesar desta indefinição, a cloud parece ser um cenário ideal para data warehouses pois são bases de dados que albergam usualmente enormes volumes de dados e são essencialmente de leitura. Com esta dissertação pretendeu-se estudar a viabilidade da implementação e migração de um sistema de data warehousing para um ambiente cloud e apresentar um protótipo que expusesse a utilidade do mesmo face a uma típica implementação in-house.The world of Information Technology is witnessing major changes since the appearance of the cloud computing concept. Cloud computing reveals itself as a means to allow easy acquisition and release, in other words elasticity, of computing resources, provides highly scalable and costly infrastructures with minimal configuration and also because it is a service with reduced costs compared to an in-house solution, because it typically uses a "pay-as-you-go" model. Of course, with the delegation of the entire infrastructure and the data to a cloud provider, issues such as security and privacy of data began to be addressed, becoming drawbacks to cloud solutions. However, in addition to cloud computing, other variables, such as the large increase of enterprise data volumes and the technological advances in broadband networks, have required the adaptation of databases to a cloud environment, which led, step by step, to the Database as a Service paradigm. Currently there are still doubts whether SQL databases will be the most suitable model for cloud environments. While this database model has dominated the market, it has several limitations (eg. in terms of scalability and assurance of the ACID properties) when confronted with implementations in a cloud environment. On the other hand, the ecosystem of applications developed under SQL databases is too large to be changed to another model. Despite this uncertainty, the cloud seems to be an ideal environment for data warehouses because these are databases that usually house huge volumes of data and are essentially used for reading purposes. The purpose of this dissertation was to study the feasibility of implementation and migration of a data warehousing system to a cloud environment and to develop a prototype that would expose its usefulness compared to a typical in-house implementation

    Similar works