Keyword Searches and Schema Transformation for Multi-Model Databases

Yuan, Gongsheng

Keyword Searches and Schema Transformation for Multi-Model Databases

Authors: Gongsheng Yuan
Publication date: 9 May 2022
Publisher: 'University of Helsinki Libraries'

Abstract

The Variety of data is promoting the evolution and development of databases. One of the influence results is the emergence of multi-model databases. So far, the database community has proposed quite a few multi-model databases to support different data models, but these databases adopt diverse methods to implement their data storage and query, which results in a heavy burden for novices to use multi-model databases. Considering this, we present our first research topic - how to employ the keyword searches method as an alternative way to explore and query multi-model databases. Besides, compared with the mature and robust relational databases dominating the current market, multi-model databases - which can not yet match them in transaction management, query optimization, security, etc. - still need time to perfect their foundations of the mathematic theory and boost performance. Considering this, we present our second research topic - how to use relational databases as an alternative way to store and query well-structured data and NoSQL data uniformly. For the first research problem, we utilize the probabilistic formalism of quantum physics to bring the problem into vector spaces and exploit non-classical probabilities to find top-k the most relevant results. As for the second research topic, it requires designing a good relational schema to store these various data in relational databases. But the challenge is that we need to address the difference of structure between flat relational tables and complex multi-model data. To address this problem, we review all relevant works, analyze existing methods, and give a literature review. As a result, we find these works focusing on handling one single data model by relational databases. There is no relevant research to handle multi-model data. Against this challenge, we prepare to employ the reinforcement learning method. This is because this method could automatically obtain an excellent relational schema from the given multi-model data and queries by interacting with the outer environment. To make this idea work in the field of databases, we define the input, goal, reward, policy, and observation according to our purpose, respectively. Besides, we present a Double Q-tables algorithm to assist in decreasing the complexity of the learning process.Datan monimuotoisuus edistää tietokantojen kehittymistä. Eräs vaikuttavimmista kehityskuluista on monimallisten tietokantojen synty,. Tietokantayhteisö on kehittänyt useita monimallisia tietokantoja tukemaan erilaisia tietomalleja. Näissä monimallisissa tietokannoissa on toteutettu monipuolisesti erilaisia tapoja tallentaa dataa ja suorittaa tietokantakyselyjä, mikä toisaalta aiheuttaa aloittelijoille vaikeuksia monimallisten tietokantojen käyttämisessä. Aloittelijoiden omaksuttava jokaisen monimallisen tietokannan kyselykieli erikseen. Näiden lisäksi käyttäjien täytyy hallita monimutkaisia ja dynaamisesti kehittyviä tietokantakaavioita, jotta he voivat muodostaa kyselyitä monimallisissa tietokannoissa. Ottaen huomioon nämä haasteet esitämme ensimmäisen tutkimuskysymyksen: kuinka käyttää avainsanahakua vaihtoehtoisena tapana suorittaa kyselyitä monimallisissa tietokannoissa? Ensimmäisen tutkimuskysymyksen osalta hyödynnämme kvanttifysiikkaan liittyvää todennäköisyyslaskennan formalismia, joka muotoilee ongelman vektoriavaruuksien avulla ja hyödyntää ei-klassisia todennäköisyyksiä. Tällöin löydetään k olennaisinta tulosta, jotka koostuvat useasta komponentista ja tietomallista. Lähestymme toista tutkimusongelmaa havaitsemalla, että monimallisen tiedon tallentaminen relaatiotietokantaan vaatii hyvän relaatiotietokantakaavion kehittämistä. Meidän täytyy ottaa huomioon yksiulotteisten relaatioiden ja monimallisen tiedon rakenteelliset erot. Aloitamme katsauksella nykyiseen aiheeseen liittyvään tutkimukseen, analysoimme olemassa olevia menetelmiä sekä kokoamme kirjallisuuskatsauksen aiheesta. Selvityksen perusteella voimme havaita, että nämä tutkimukset keskittyvät yhden tietomallin käsittelemiseen relaatiotietokannoissa eikä monimallista tietoa ole toistaiseksi käsitelty tutkimuksissa lainkaan. Vastataksemme tähän haasteeseen kehitämme vahvistusoppimiseen perustuvan menetelmän, jolla pystymme tuottamaan erinomaisen relaatiokaavion monimalliselle tiedolle sekä kyselyille vuorovaikutuksessa ympäristön kanssa. Jotta kykenemme soveltamaan tätä ideaa tietokantatutkimuksessa, määrittelemme tarkoituksiimme sopivan syötteen, tavoitteen, palkkiosysteemin, menettelytavan ja havainnot. Lisäksi esittelemme ns. Double Q-tables -algoritmin, joka auttaa koneoppimisprosessin vaativuuden vähentämisessä

Similar works

Full text

Open in the Core reader

Download PDF

Available Versions

Helsingin yliopiston digitaalinen arkisto

oai:helda.helsinki.fi:10138/34...

Last time updated on 17/05/2022