Hadoop

Abstract

Tämän opinnäytetyön tavoitteena oli tarjota kattava kokonaisuus siitä miltä Hadoop näyttää ja mitä sillä voidaan tehdä. Työssä pyritään esittelemään kattavasti erilaisia teknologioita, jotka mahdollistavat erinäisiä toimintoja mitä entiset ratkaisut eivät kyenneet. Työ käsittelee erinäisiä tietokanta ratkaisuja ja näiden toimintaan tietokantoina. Miten näitä on kehitetty ja mitä puutteita on vielä löydettävissä. Aiheessa pyrittiin kuvaamaan sitä millaisesta ekosysteemistä on kyse, kun puhutaan yritysmaailman Hadoop ratkaisuista, sekä kilpailusta Hadoop tarjonnassa. Pääasiana opinnäytetyössä itselleni oli tutkia erinäisiä tuotteita, joita markkinoilta löytyy ja näi-den tuomia ratkaisuja. Kuvaavana tästä työssä käsiteltiin aina levyjaosta tiedon metatiedon hal-lintaan.This thesis had a goal to give comprehensive understanding of Hadoop and its technologies and how it’s used. This work tries to show large scale of different technologies. There are mul-tiple different database solutions and ways to work with these solutions. During this I also tried to bring across how the technology might affect us in future. One of the sub goals is to give understanding to how organizations use Hadoop for business. Thesis also tries to introduce the different vendors that are currently out in Hadoop world. Overall the goal is to give you understanding of what someone is talking about when they talk about Hadoop. Topics goes from network shared disk to data’s metadata. Introducing such topics as NoSQL in Hadoop and how to bring log data into Hadoop

Similar works

This paper was published in Theseus.

Having an issue?

Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.