Dissertação de mestrado em Engenharia InformáticaO universo das Tecnologias de Informação está a assistir a grandes mudanças desde o surgimento do
conceito de cloud computing. A cloud computing revela-se como um meio que possibilita a fácil
aquisição e liberação (elasticidade) de recursos computacionais, que disponibiliza infraestruturas
altamente escaláveis e dispendiosas com o mínimo de configuração possível e, ainda, pelo facto de
ser um serviço com custos reduzidos comparativamente a uma solução in-house, pois tipicamente
utiliza um modelo “pay-as-you-go”. Claro que com a delegação de toda a infraestrutura e dos dados
para um provedor de clouds, questões como a segurança e privacidade dos dados começaram a ser
equacionadas, apresentando-se assim como desvantagens para soluções em cloud. No entanto, além
da cloud computing, outras variáveis, como o grande aumento do volume de dados nas empresas e
os avanços tecnológicos alcançados nas redes de banda larga, têm “exigido” a adaptação das bases
de dados para um ambiente em cloud, o que originou, pouco a pouco, o paradigma de Database as a
Service. Atualmente ainda existem dúvidas relativamente às bases de dados SQL, sobre se estas serão
as mais indicadas para ambientes cloud. Este modelo de bases de dados tem dominado o mercado
mas apresenta diversas limitações (por exemplo a nível de escalabilidade e garantia das propriedades
ACID) quando confrontadas com implementações num ambiente cloud. Por outro lado, o ecossistema
de aplicações desenvolvidas com bases de dados SQL é demasiado grande para ser modificado para
outro modelo. Apesar desta indefinição, a cloud parece ser um cenário ideal para data warehouses
pois são bases de dados que albergam usualmente enormes volumes de dados e são essencialmente
de leitura. Com esta dissertação pretendeu-se estudar a viabilidade da implementação e migração de um sistema
de data warehousing para um ambiente cloud e apresentar um protótipo que expusesse a utilidade do
mesmo face a uma típica implementação in-house.The world of Information Technology is witnessing major changes since the appearance of the
cloud computing concept. Cloud computing reveals itself as a means to allow easy acquisition and
release, in other words elasticity, of computing resources, provides highly scalable and costly
infrastructures with minimal configuration and also because it is a service with reduced costs
compared to an in-house solution, because it typically uses a "pay-as-you-go" model. Of course,
with the delegation of the entire infrastructure and the data to a cloud provider, issues such as
security and privacy of data began to be addressed, becoming drawbacks to cloud solutions.
However, in addition to cloud computing, other variables, such as the large increase of enterprise
data volumes and the technological advances in broadband networks, have required the adaptation
of databases to a cloud environment, which led, step by step, to the Database as a Service
paradigm. Currently there are still doubts whether SQL databases will be the most suitable model
for cloud environments. While this database model has dominated the market, it has several
limitations (eg. in terms of scalability and assurance of the ACID properties) when confronted with
implementations in a cloud environment. On the other hand, the ecosystem of applications
developed under SQL databases is too large to be changed to another model. Despite this
uncertainty, the cloud seems to be an ideal environment for data warehouses because these are
databases that usually house huge volumes of data and are essentially used for reading purposes.
The purpose of this dissertation was to study the feasibility of implementation and migration of a
data warehousing system to a cloud environment and to develop a prototype that would expose its
usefulness compared to a typical in-house implementation