6 research outputs found

    Transformasi Ontologi ke Model Dimensional

    Get PDF
    Data warehouse  adalah salah satu komponen penting untuk analisis bisnis yang efektif. Salah satu model pada data warehouse adalah dimensional model yang banyak digunakan karena performa permrosesan yang lebih cepat dari model lain. Dua faktor utama pada perancangan dimensional model adalah adalah sumber data dan kebutuhan bisnis.Salah satu sumber data yang banyak digunakan adalah ontologi karena mampu merepresentasikan data menjadi informasi yang koheren yang dapat dimasukkan ke dalam Data Warehouse. Dalam penelitian ini dihasilkan sebuah tools berbasis ontologi yang digunakan untuk secara otomatis mendapatkan dimensional model untuk data warehouse dari sumber data dan kebutuhan bisnis. Tahapan yang dilakukan mengidentifikasi semua informasi pada file ontology yang dimasukkan pengguna, kemudian daftar dimensi dan fact dihasilkan berdasarkan aturan perancangan dimensional model. Pembuatan fact tabel dan dimensi tabel dirancang berdasarkan rule perancangan dimensional model yang diperkenalkan oleh Kimball. Setelah tabel fact dan dimensidiidentifikasi, maka tabel fact dan dimensi tersebut diubah ke dalam bentuk kueri yang dapat dieksekusi pada MySQL. Penelitian ini berhasil menghasilkan dimensional model dari sumber data ontology.AbstractThe data warehouse is one of the essential components for effective business analysis. One of the models in the data warehouse is the dimensional model that is widely used because the processing performance is faster than other models. The two main factors in designing a dimensional model are data sources and business requirements. One of the most widely used data sources is ontology because it is able to represent data into coherent information that can be entered into the Data Warehouse. In this research, an ontology-based tool is produced which is used to automatically obtain dimensional models for the data warehouse from data sources and business needs. The step taken identifies all the information in the ontology file entered by the user, then a list of dimensions and facts is generated based on the design rules for the dimensional model. The creation of fact tables and dimension tables are designed based on the dimensional model design rules introduced by Kimball. After the fact and dimension tables are identified, the fact and dimension tables are converted into queries that can be executed in MySQL. This study succeeded in producing dimensional models from the ontology data source.

    Implementação de um data warehouse, uma perspetiva bibliométrica

    Get PDF
    With the huge flow of information generated by organizations, it is important that they have the concern to store the data in a single system, a data warehouse. In addition to extracting, cleaning, transforming, and delivering the information data into a single database, this system supports organizations in the management and strategic decision-making. The objective of this article is to expose the most important topics to consider when implementing this system in an organization, such as the choice of architecture, internal organizational factors that guarantee the success of the implementation of a data warehouse and security issues, which should not be forgotten. Finally, a future perspective is briefly mentioned, combining 5G and data warehouse technologies, making the system more efficient, safer, and cheaper.Com o enorme fluxo de informação gerado pelas organizações, é importante que estas tenham a preocupação de armazenar os dados num sistema só, num data warehouse. Para além da extração, limpeza, transformação e entrega os dados de informação numa só base de dados, este sistema apoia as organizações na gestão e na tomada de decisões estratégicas. O objetivo deste artigo prende-se na exposição dos tópicos mais importantes a ter em conta no momento de implementar este sistema numa organização, como é o caso da escolha da arquitetura, fatores organizacionais internos que garantem o sucesso da implementação de um data warehouse e as questões de segurança, que não devem ser esquecidas. Por fim, é referido, de uma forma breve, uma perspetiva futura, que conjuga as tecnologias 5G e data warehouse, tornando o sistema mais eficiente, seguro e mais barato

    Implementación de una solución de Inteligencia de Negocios para el incremento de la eficiencia en la gestión de incidencias del área de monitoreo de redes de la Sub Gerencia de Operaciones Telemáticas del RENIEC

    Get PDF
    El presente estudio tuvo como propósito implementar una solución de Inteligencia de Negocios para incrementar la eficiencia en la gestión de incidencias del área de monitoreo de redes de la Sub Gerencia de Operaciones Telemáticas del RENIEC. El tipo de investigación que fue desarrollado tuvo un enfoque cuantitativo, pre-experimental de corte longitudinal. La solución de Inteligencia de Negocios fue desarrollada utilizando la metodología Hefesto v3, tomando como punto de partida la recolección de requerimientos y necesidades de información por parte de los usuarios y concluyendo con la elaboración de un esquema lógico con sus respectivos procesos de extracción, transformación y carga de datos (ETL). Se utilizó Microsoft SQL Server como base de datos y SQL Server Integration Services como herramienta para el despliegue del ETL. Para el desarrollo de la investigación se elaboró un cuestionario; el cual fue el instrumento de evaluación del estado de la gestión de incidencias antes y después de la implementación de la solución de Inteligencia de Negocios, este instrumento fue validado a través de juicio de expertos. Los resultados obtenidos del instrumento se analizaron utilizando la prueba t’student para muestras relacionadas. Los resultados constataron la efectividad de la solución de Inteligencia de Negocios, demostrando que hubo una mejora significativa en el tiempo de elaboración de reportes, tiempo requerido en el análisis de la información de los reportes y la calidad de la información de estos.LIMAEscuela Profesional de Ingeniería de SistemasTecnología de información e innovación tecnológic

    Continuous Delivery in Data Warehousing

    Get PDF
    Tämän väitöskirjan motivaatio kumpuaa käytännön ongelmasta: kuinka lyhentää aikaa ideasta analysoida jotain siihen, että analyysi on käyttäjien saatavilla. Tietovarastointia on perinteisesti pidetty monimutkaisena ja siten herkkänä virheille. Tietovarastoinnissa erilliset vaiheet tapahtuvat peräkkäin ennalta määritellyssä järjestyksessä. Perinteinen tapa tietovarastoinnissa on ottaa koko ratkaisu kerralla tuotantokäyttöön, jossa kaikki tietovaraston palaset ovat paikoillaan ennen tuotantokäyttöä. Mikäli kehitys seuraa lyhyitä iteraatioita, miksi käyttöönotot tuotantoon eivät seuraa näitä iteraatioita? Tämä väitöskirja esittelee kuinka raportointi- ja tietovarastointitiimit voivat rakentaa yhtäaikaa raportointiratkaisuja (business intelligence) vaiheittain. Yhteistyö tehostaa kehittäjien välistä kommunikaatiota ja lyhentää palautesykliä loppukäyttäjältä kehittäjille mikä tekee palautteesta suorempaa. Jatkuvan käyttöönoton käytännöt tukevat julkaisemista usein tuotantoympäristöön. Kaksikerroksinen tietovarastoarkkitehtuuri erottaa analyyttisen ja tapahtumapohjaisen käsittelyn. Erilaisten käsittelyjen erottaminen mahdollistaa paremman testauksen ja siten jatkuvan käyttöönoton. Käytettäessä jatkuvaa käyttöönottoa, voidaan kehitysaikaa lyhentää myös automatisoimalla tietomuunnosten toteutustyötä. Tämä väitöskirja esittelee tietomallin tietomuunnosten automatisoinnin toteuttamista varten, niin tiedon saattamiseksi tietovarastoon kuin tiedon hyödyntämiseen tietovarastosta. Tutkimuksen arvioinnissa noudatettiin suunnittelutieteen suuntaviivoja. Tutkimus tehtiin yhteistyössä teollisuuden ja yliopistojen kanssa. Näitä ideoita on testattu todellisissa projekteissa lupaavin tuloksin ja siten ne on todistettu toimiviksi.Continuous delivery is an activity in the field of continuous software engineering. Data warehousing, on the other hand, lie within information systems research. This dissertation combines these two traditionally separate concerns of continuous delivery and data warehousing. This dissertation’s motivation stems from a practical problem: how to shorten the time from a reporting idea until it is available for users. Data warehousing has traditionally been considered tedious and delicate. In data warehousing, distinct steps take place one after another in a predefined unalterable sequence. Another traditional aspect of data warehousing is bringing everything at once to a production environment, where all the pieces of a data warehouse are in place before production use. If development follows agile iterations, why are the releases in production not following the same iterations? This dissertation introduces how reporting and data warehouse teams can synchronously build business intelligence solutions in increments. Joint working enhances communication between developers and shortens the feedback cycle from an end-user to developers, and makes the feedback more direct. Continuous delivery practices support releasing frequently to a production environment. A two-layer data warehouse architecture separates analytical and transactional processing. Separating different processing targets enables better testing and, thus, continuous delivery. When frequently deploying with continuous delivery practices, automating transformation creation in data warehousing reduces the development time. This dissertation introduces an information model for automating the implementation of transformations, getting data into a data warehouse and getting data out of it. The research evaluation followed the design science guidelines. Research for this dissertation collaborated with the industry. These ideas have been tested on real projects with promising results, and thus they have been proven to work

    DATA WAREHOUSE ARCHITECTURE CLASSIFICATION

    No full text
    Diplomski rad daje pregled i usporedbu arhitektura skladišta podataka. Jednoslojna, dvoslojna i troslojna arhitektura su strukturno-orijentirane arhitekture koje ovise o broju slojeva unutar arhitektura. Kod arhitektura nezavisnih data mart-ova, bus, hub-and-spoke, centralizirane i distribuirane arhitekture, osnovni slojevi su različito kombinirani. Usporedba organizacijskih struktura za sve arhitekture, na temelju postavljenih kriterija, iznosi sličnosti i različitosti s obzirom na organizacijsku strukturu. Uz to, dana je i usporedba na temelju konzistentnosti, potpunosti i točnosti informacija te integracije, fleksibilnosti i skalabilnosti sustava za arhitekturu nezavisnih data mart-ova, bus, hub-and-spoke, centraliziranu i distribuiranu arhitekturu te su identificirani kriteriji ključni pri odabiru određene arhitekture. Bus, hub-and-spoke i centralizirana arhitektura su pokazale najbolje rezultate prilikom usporedbi. U današnje doba potreba za pohranom velikih količina podataka nadilazi kapacitet pohrane jednog računalnog sustava. Pojavljuju se pojmovi NoSQL i Big Data skladišta podataka. Hoće li zbog njih tradicionalna skladišta podataka pasti u zaborav

    DATA WAREHOUSE ARCHITECTURE CLASSIFICATION

    No full text
    Diplomski rad daje pregled i usporedbu arhitektura skladišta podataka. Jednoslojna, dvoslojna i troslojna arhitektura su strukturno-orijentirane arhitekture koje ovise o broju slojeva unutar arhitektura. Kod arhitektura nezavisnih data mart-ova, bus, hub-and-spoke, centralizirane i distribuirane arhitekture, osnovni slojevi su različito kombinirani. Usporedba organizacijskih struktura za sve arhitekture, na temelju postavljenih kriterija, iznosi sličnosti i različitosti s obzirom na organizacijsku strukturu. Uz to, dana je i usporedba na temelju konzistentnosti, potpunosti i točnosti informacija te integracije, fleksibilnosti i skalabilnosti sustava za arhitekturu nezavisnih data mart-ova, bus, hub-and-spoke, centraliziranu i distribuiranu arhitekturu te su identificirani kriteriji ključni pri odabiru određene arhitekture. Bus, hub-and-spoke i centralizirana arhitektura su pokazale najbolje rezultate prilikom usporedbi. U današnje doba potreba za pohranom velikih količina podataka nadilazi kapacitet pohrane jednog računalnog sustava. Pojavljuju se pojmovi NoSQL i Big Data skladišta podataka. Hoće li zbog njih tradicionalna skladišta podataka pasti u zaborav
    corecore