Search CORE

28 research outputs found

Äriprotsessi tulemuste ennustav ja korralduslik seire

Author: Teinemaa Irene
Publication venue
Publication date: 14/03/2019
Field of study

Viimastel aastatel on erinevates valdkondades tegutsevad ettevõtted üles näidanud kasvavat huvi masinõppel põhinevate rakenduste kasutusele võtmiseks. Muuhulgas otsitakse võimalusi oma äriprotsesside efektiivsuse tõstmiseks, kasutades ennustusmudeleid protsesside jooksvaks seireks. Sellised ennustava protsessiseire meetodid võtavad sisendiks sündmuslogi, mis koosneb hulgast lõpetatud äriprotsessi juhtumite sündmusjadadest, ning kasutavad masinõppe algoritme ennustusmudelite treenimiseks. Saadud mudelid teevad ennustusi lõpetamata (antud ajahetkel aktiivsete) protsessijuhtumite jaoks, võttes sisendiks sündmuste jada, mis selle hetkeni on toimunud ning ennustades kas järgmist sündmust antud juhtumis, juhtumi lõppemiseni jäänud aega või instantsi lõpptulemust. Lõpptulemusele orienteeritud ennustava protsessiseire meetodid keskenduvad ennustamisele, kas protsessijuhtum lõppeb soovitud või ebasoovitava lõpptulemusega. Süsteemi kasutaja saab ennustuste alusel otsustada, kas sekkuda antud protsessijuhtumisse või mitte, eesmärgiga ära hoida ebasoovitavat lõpptulemust või leevendada selle negatiivseid tagajärgi. Erinevalt puhtalt ennustavatest süsteemidest annavad korralduslikud protsessiseire meetodid kasutajale ka soovitusi, kas ja kuidas antud juhtumisse sekkuda, eesmärgiga optimeerida mingit kindlat kasulikkusfunktsiooni. Käesolev doktoritöö uurib, kuidas treenida, hinnata ja kasutada ennustusmudeleid äriprotsesside lõpptulemuste ennustava ja korraldusliku seire raames. Doktoritöö pakub välja taksonoomia olemasolevate meetodite klassifitseerimiseks ja võrdleb neid katseliselt. Lisaks pakub töö välja raamistiku tekstiliste andmete kasutamiseks antud ennustusmudelites. Samuti pakume välja ennustuste ajalise stabiilsuse mõiste ning koostame raamistiku korralduslikuks protsessiseireks, mis annab kasutajatele soovitusi, kas protsessi sekkuda või mitte. Katsed näitavad, et väljapakutud lahendused täiendavad olemasolevaid meetodeid ning aitavad kaasa ennustava protsessiseire süsteemide rakendamisele reaalsetes süsteemides.Recent years have witnessed a growing adoption of machine learning techniques for business improvement across various fields. Among other emerging applications, organizations are exploiting opportunities to improve the performance of their business processes by using predictive models for runtime monitoring. Such predictive process monitoring techniques take an event log (a set of completed business process execution traces) as input and use machine learning techniques to train predictive models. At runtime, these techniques predict either the next event, the remaining time, or the final outcome of an ongoing case, given its incomplete execution trace consisting of the events performed up to the present moment in the given case. In particular, a family of techniques called outcome-oriented predictive process monitoring focuses on predicting whether a case will end with a desired or an undesired outcome. The user of the system can use the predictions to decide whether or not to intervene, with the purpose of preventing an undesired outcome or mitigating its negative effects. Prescriptive process monitoring systems go beyond purely predictive ones, by not only generating predictions but also advising the user if and how to intervene in a running case in order to optimize a given utility function. This thesis addresses the question of how to train, evaluate, and use predictive models for predictive and prescriptive monitoring of business process outcomes. The thesis proposes a taxonomy and performs a comparative experimental evaluation of existing techniques in the field. Moreover, we propose a framework for incorporating textual data to predictive monitoring systems. We introduce the notion of temporal stability to evaluate these systems and propose a prescriptive process monitoring framework for advising users if and how to act upon the predictions. The results suggest that the proposed solutions complement the existing techniques and can be useful for practitioners in implementing predictive process monitoring systems in real life

DSpace at Tartu University Library

Kvaliteedi hindamine tähelepanu abil

Author: Yankovskaya Elizaveta
Publication venue
Publication date: 11/05/2022
Field of study

Väitekirja elektrooniline versioon ei sisalda publikatsiooneMasintõlge on saanud osaks mitte ainult keeleteadlaste ja professionaalsete tõlkijate, vaid peaaegu kõigi elust. Enamik inimesi, kes on kasutanud masintõlget, on kohanud naljakaid ja kohati täiesti valesid tõlkeid, mis lause tähendust täielikult moonutavad. Seega peame peale masintõlke mudeli kasutama hindamismehhanismi, mis teavitab inimesi tõlgete kvaliteedist. Loomulikult saavad professionaalsed tõlkijad masintõlke väljundit hinnata ja vajadusel toimetada. Inimeste märkuste kasutamine veebipõhiste masintõlkesüsteemide tõlgete hindamiseks on aga äärmiselt kulukas ja ebapraktiline. Seetõttu on automatiseeritud tõlkekvaliteedi hindamise süsteemid masintõlke töövoo oluline osa. Kvaliteedihinnangu eesmärk on ennustada masintõlke väljundi kvaliteeti, ilma etalontõlgeteta. Selles töös keskendusime kvaliteedihinnangu mõõdikutele ja käsitleme tõlkekvaliteedi näitajana tähelepanumehhanismi ennustatud jaotusi, mis on üks kaasaegsete neuromasintõlke (NMT) süsteemide sisemistest parameetritest. Kõigepealt rakendasime seda rekurrentsetel närvivõrkudel (RNN) põhinevatele masintõlkemudelitele ja analüüsisime pakutud meetodite toimivust juhendamata ja juhendatud ülesannete jaoks. Kuna RNN-põhised MT-süsteemid on nüüdseks asendunud transformeritega, mis muutusid peamiseks tipptaseme masintõlke tehnoloogiaks, kohandasime oma lähenemisviisi ka transformeri arhitektuurile. Näitasime, et tähelepanupõhised meetodid sobivad nii juhendatud kui ka juhendamata ülesannete jaoks, kuigi teatud piirangutega. Kuna annotatsiooni andmete hankimine on üsna kulukas, uurisime, kui palju annoteeritud andmeid on vaja kvaliteedihinnangu mudeli treenimiseks.Machine translation has become a part of the life of not only linguists and professional translators, but almost everyone. Most people who have used machine translation have come across funny and sometimes completely incorrect translations that turn the meaning of a sentence upside down. Thus, apart from a machine translation model, we need to use a scoring mechanism that informs people about the quality of translations. Of course, professional translators can assess and, if necessary, edit the machine translation output. However, using human annotations to evaluate translations of online machine translation systems is extremely expensive and impractical. That is why automated systems for measuring translation quality are a crucial part of the machine translation pipeline. Quality Estimation aims to predict the quality of machine translation output at run-time without using any gold-standard human annotations. In this work, we focused on Quality Estimation methods and explored the distribution of attention—one of the internal parameters of modern neural machine translation systems—as an indicator of translation quality. We first applied it to machine translation models based on recurrent neural networks (RNNs) and analyzed the performance of proposed methods for unsupervised and supervised tasks. Since transformer-based machine translation models had supplanted RNN-based, we adapted our approach to the attention extracted from transformers. We demonstrated that attention-based methods are suitable for both supervised and unsupervised tasks, albeit with some limitations. Since getting annotation labels is quite expensive, we looked at how much annotated data is needed to train a quality estimation model.https://www.ester.ee/record=b549935

DSpace at Tartu University Library

Haiguste ja koespetsiifiliste DNA metülatsioonil põhinevate biomarkerite uurimine

Author: Modhukur Vijayachitra
Publication venue
Publication date: 29/04/2019
Field of study

Väitekirja elektrooniline versioon ei sisalda publikatsiooneDNA-s sisalduv geneetiline informatsioon annab vajalikud juhised organismi kasvuks ja arenguks. Lisaks DNA nukleotiidsele järjestusele mõjutavad neid protsesse ka DNA-s esinevad modifikatsioonid. Enim uuritud DNA modifikatsioon on DNA metülatsioon, mis tähendab metüülrühma lisamist tsütosiini külge. DNA on tihtilugu metüleeritud regiooniti, moodustades niinimetatud metülatsioonimustreid. Need “mustrid“ osalevad geeniekspressiooni regulatsioonis, lülitades teatud rakkudes geene sisse ja välja või kohandades nende aktiivsust. On oluline märkida, et DNA metülatsioon on tugevalt mõjutatud keskkonnateguritest, nimelt vastavalt keskkonnatingimustele võidakse teatud regioone metüleerida või vastupidi, metüülrühmi eemaldada. Seega on DNA metülatsioon üheks vahelüliks geneetika ja keskkonna vahel. Paljud neist “mustritest“ on omased tavalistele bioloogilistele protsessidele, kuid leidub ka selliseid, mis viitavad haiguse olemasolule. Näiteks on spetsiifilisi metülatsioonimustreid täheldatud diabeedi, neuroloogiliste häirete ja vähi puhul. Seetõttu peetakse neid “mustreid“ ka headeks biomarkeri kandidaatideks, sobides iseloomustama näiteks teatud haiguste kulgu. Käesolev väitekiri keskendubki DNA metülatsiooni uurimisele erinevates kudedes ja seisundites, et leida potentsiaalseid biomarkereid. Selleks kasutati erinevaid bioinformaatika ja statistika meetodeid. Kokku viidi läbi kolm publitseeritud uuringut, mille käigus uuriti nii koe- kui endometrioosispetsiifilisi biomarkeri kandidaate kui ka DNA metülatsiooni muutusi emaka endomeetriumi embrüole vastuvõtlikuks muutumise perioodil. Lisaks arendati doktoritöö raames välja uudne ja kasutajasõbralik veebirakendus – MethSurv, mis kasutades suurprojekti “The Cancer Genome Atlas” (TCGA) andmeid, võimaldab kasutajal uurida vähipatsientide elumust konkreetse DNA metülatsioonil põhineva prognostiliste markeri põhjal.DNA contains the genetic information required for the growth and development of the organism. In addition to the nucleotide sequence, certain chemical modifications influence the activity of the DNA. The most studied DNA modification is DNA methylation, where a methyl group is added to the cytosine base of the DNA. DNA is often methylated within a genomic region, forming so-called “methylation patterns.” These "patterns" are involved in the regulation of gene expression by switching genes in and out of certain cells or adjusting their activity. Environmental factors strongly influence DNA methylation; wherein certain genomic regions may be methylated or unmethylated. Thus, methylation patterns serve as a mediator between the environment and genomes. Many of these "patterns" are inherited in normal biological processes. However, some of these patterns indicate the presence of the disease. For example, specific methylation patterns have been observed in diabetes, neurological disorders, and cancer. Therefore, methylation patterns are considered as biomarker candidates to characterize the progression of certain diseases or normal biological process. This thesis focuses on the study of DNA methylation in different tissues and conditions to identify potential biomarker candidates using various bioinformatics and statistical methods. In total, three studies were included in this thesis to investigate both tissue and endometriosis-specific biomarker candidates as well as changes in DNA methylation during the transition from pre-receptive to the receptive state of the endometrium. In addition, a novel and user-friendly web application MethSurv was developed in this thesis. MethSurv uses methylation and clinical data from the publicly available “The Cancer Genome Atlas” (TCGA). The MethSurv tool is aimed at assisting the scientific community in exploring methylation-based prognostic biomarkers.https://www.ester.ee/record=b522744

DSpace at Tartu University Library

Algoritmilise mõtlemise oskuste hindamise mudel

Author: Palts Tauno
Publication venue
Publication date: 06/05/2021
Field of study

Väitekirja elektrooniline versioon ei sisalda publikatsiooneTehnoloogia on kõikjal meie ümber ja arvutiteadus pole enam ainult eraldi distsipliin teadlastele, vaid omab aina laiemat rolli ka teistel aladel. Huvi algoritmilise mõtlemise arendamise vastu kasvab kõigil haridustasemetel alates eelkoolist lõpetades ülikooliga. Sellega seoses vajame aina enam üldhariduskoolide tasemel uuringuid, et omada paremat ülevaadet algoritmilise mõtlemise oskustest, et luua praktiline mudel algoritmilise mõtlemise hindamiseks. Algoritmilist mõtlemist kirjeldatakse paljudes artiklites, kuid sageli pole need omavahel kooskõlas ja puudub ühine arusaamine algoritmilise mõtlemise oskuste dimensioonidest. Doktoritöö sisaldab süstemaatilist kirjanduse analüüsi, kus mõjukamate artiklite sünteesimisel jõutakse kolmeetapilise algoritmilise mõtlemise oskuste mudelini. See mudel koosneb järgnevatest etappidest: i) probleemi defineerimine, ii) probleemi lahendamine ja iii) lahenduse analüüsimine. Need kolm etappi sisaldavad kümmet algoritmilise mõtlemise alamoskust: probleemi formuleerimine, abstrahheerimine, reformuleerimine, osadeks võtmine, andmete kogumine ja analüüs, algoritmiline disain, paralleliseerimine ja itereerimine, automatiseerimine, üldistamine ning tulemuse hindamine. Selleks, et algoritmilist mõtlemist süstemaatiliselt arendada, on vaja mõõtevahendit vastavate oskuste mõõtmiseks põhikoolis. Doktoritöö uurib informaatikaviktoriini Kobrase ülesannete abil, milliseid algoritmilise mõtlemise osaoskusi on võimalik eraldada Kobrase viktoriini tulemustest lähtuvalt ilmnes kaks algoritmilise mõtlemise oskust: algoritmiline disain ja mustrite äratundmine. Lisaks põhikoolile kasutati ülesandeid ka gümnaasiumis millga kinnitati, et kohendatud kujul saab neid ülesandeid kasutada algoritmilise mõtlemise oskuste hindamiseks ka gümnaasiumisgümnaasiumitasemel. Viimase asjana pakutakse doktoritöös välja teoreetilisi ja empiirilisi tulemusi kokkuvõttev algoritmilise mõtlemise oskusi hindav mudel.In the modernizing world, computer science is not only a separate discipline for scientists but has an essential role in many fields. There is an increasing interest in developing computational thinking (CT) skills at various education levels – from kindergarten to university. Therefore, at the comprehensive school level, research is needed to have an understanding of the dimensions of CT skills and to develop a model for assessing CT skills. CT is described in several articles, but these are not in line with each other, and there is missing a common understanding of the dimensions of the skills that should be in the focus while developing and assessing CT skills. In this doctoral study, through a systematic literature review, an overview of the dimensions of CT presented in scientific papers is given. A model for assessing CT skills in three stages is proposed: i) defining the problem, ii) solving the problem, and iii) analyzing the solution. Those three stages consist of ten CT skills: problem formulation, abstraction, problem reformulation, decomposition, data collection and analysis, algorithmic design, parallelization and iteration, automation, generalization, and evaluation. The systematic development of CT skills needs an instrument for assessing CT skills at the basic school level. This doctoral study describes CT skills that can be distinguished from the Bebras (Kobras) international challenge results. Results show that wto CT skills emerged that can be characterized as algorithmic thinking and pattern recognition. These Bebras tasks were also modified to be used for setting directions for developing CT skills at the secondary school level. Eventually, a modified model for assessing CT skills is presented, combining the theoretical and empirical results from the three main studies.https://www.ester.ee/record=b543136

DSpace at Tartu University Library

Bioinformaatika meetodid personaalses farmakoteraapias

Author: Tasa Tõnis
Publication venue
Publication date: 27/06/2019
Field of study

Väitekirja elektrooniline versioon ei sisalda publikatsiooneKogutavate terviseandmete hulk kasvab kiiresti. Tänu neile andmetele on meditsiinilise ravi pakkumisel võimalik senisest enam arvesse võtta individuaalseid bioloogilisi andmeid. See doktoritöö käsitleb mitmeid personaalses meditsiinis esinevaid probleeme ja näitab, et ravi individualiseerimiseks kasutatavad andmed tulevad väga erinevatest allikatest. Inimestevahelised erinevused teevad ravimite metabolismi ennustamise keerukaks, siiski on ravi käigus kogutavad kontsentratsioonimõõtmised ravimiefekti hindamisel heaks allikaks. Me arendasime välja täppisdoseerimise tööriista, mis võimaldab vankomütsiini ravil vastsündinutele määrata ravi tõhustavat personaalseid doose kasutades selleks nende endi ravi käigus kogutud kontsentratsioone. Suurema osa ravimiteraapiate puhul ei ole võimalik pidevalt ravimi kontsentratsioone koguda. Nende ülejäänud ravimite puhul on heaks informatsiooniallikaks geneetika. Paljude ravimimetabolismiga seotud geneetiliste variantide mõju on piisav, et tingida muutuseid ravi läbiviimisel. Me uurisime geneetika ja ravimite kõrvalmõjude omavahelisi seoseid kasutades rahvastikupõhist lähenemist. See toetus Eesti Geenivaramu geeniandmetele ja teistele laiapõhjalistele terviseandmete registritele. Me leidsime ja valideerisime seose, et CTNNA3 geenis olev geenivariant tõstab oksikaamide ravil olevate inimeste jaoks kõrvalmõjude sagedust. Arvutuslik geneetika toetub kvantitatiivsetele meetoditele, millest kõige levinum on ülegenoomne assotsiatsiooni analüüs (GWAS). Sagedasti kasutatav GWASi järelsamm on aega nõudev GWASist ilmnenud p-väärtuste visuaalne hindamine teiste samas genoomi piirkonnas olevate geneetiliste variantide kontekstis. Selle sammu automatiseerimiseks arendasime me kaks tööriista, Manhattan Harvester ja Cropper, mis võimaldavad automaatselt huvipakkuvaid piirkondi tuvastada ja nende headust hinnata.The amount of collected health data is growing fast. Insights from these data allow using biological patient specifics to improve therapy management with further individualization. This thesis addresses problems in multiple sub-fields of personalised medicine and aims to illustrate that data for precision medicine emerges from different sources. Drug metabolism is difficult to predict because individual biological differences. Fortunately, drug concentrations are a good proxy for drug effect. To address the growing need for tools that allow on-line therapy adjustment based on individual concentrations we have developed and externally evaluated a precision dosing tool that allows individualised dosing of vancomycin in neonates. Other than drugs used in therapeutic drug monitoring, most pharmacotherapies can not rely on continuous concentration measurements but for such drugs genetics provides a valuable source of information for individualization. Effects of many genetic variants in drug metabolism pathways are often large enough to require changes in drug prescriptions or schedules. We have applied a population-based approach in testing relations between drug related adverse effects and genomic loci, and found and validated a novel variant in CTNNA3 gene that increases adverse drug effects in patients with oxicam prescriptions. This was done by leveraging the data in Estonian Genome Center and linking these to nation-wide electronic health data registries. Computational genetics relies on quantitative methods for which the most common is the genome-wide association analysis (GWAS). A common GWAS downstream step involves time-consuming visual assessment of the association study p-values in context with other variants in genomic vicinity. In order to streamline this step, we developed, Manhattan Harvester and Cropper, that allow for automated detection of peak areas and assign scores by emulating human evaluators.https://www.ester.ee/record=b524282

DSpace at Tartu University Library

Universitas Tartuensis : UT : Tartu Ülikooli ajakiri nr 4

Author
Publication venue: Tartu : Tartu Ülikool
Publication date: 01/04/2019
Field of study

https://www.ester.ee/record=b2459950*es

DSpace at Tartu University Library

Tehisnärvivõrgud bioloogiliste andmete analüüsimiseks

Author: Tampuu Ardi
Publication venue
Publication date: 02/09/2020
Field of study

Väitekirja elektrooniline versioon ei sisalda publikatsiooneTehisnärvivõrgud viimastel aastatel populaarsust kogunud masinõppe algoritm, mis on võimeline näidete põhjal õppima. Erinevad tehisnärvivõrkude alamtüübid on kasutusel mitmetes arvutiteaduse harudes: konvolutsioonilisi võrke rakendatakse objekti- ja näotuvastuses; rekurrentsed võrgud on efektiivsed kõnetuvastuses ja keeletehnoloogias. Need ei ole aga ainsad võimalikud tehisnärvivõrkude rakendamise valdkonnad - selles doktoritöös näitasime me tehisnärvivõrkude kasulikkust kahe bioloogilise probleemi lahendamisel. Esiteks küsisime, kas ainult DNA jupis sisalduva info põhjal on võimalik ennustada, kas see järjestus pärineb viiruse (ja mitte mõnda muud tüüpi organismi) genoomist. Läbi kahe publikatsiooni tõestasime me, et masinõppe algoritmid on selleks tõesti võimelised. Parima täpsuse saavutas konvolutsiooniline närvivõrk. Loodud lahendus võimaldab viroloogidel tuvastada seni tundmatuid viiruseliike, millel võib olla oluline mõju inimese tervisele. Teine käsitletud bioloogiline andmestik pärineb neuroteadusest. Imetajate hipokampuses esineb nn. koharakke, mis aktiveeruvad vaid juhul, kui loom asub teatud ruumipunktis. Näitasime, et rekurrentsete närvivõrkude abil saab vaid mõnekümne koharaku aktiivsuse põhjal ennustada roti asukohta ligi 10 cm täpsusega. Rekurrentsed võrgud osutusid efektiivsemaks kui neuroteaduses enim levinud Bayesi meetodid. Need võrgud suudavad kasutada rakkude eelnevat aktiivsust kontekstina, mis aitab täpsustada asukoha ennustust. Ka teistes neuroandmestikes võib eelnev ajuaktiivsus peegeldada konteksti, mis sisaldab olulist infot hetkel toimuva kohta. Seega võivad rekurrentsed tehisnärvivõrgud osutuda ajusignaalide mõistmisel ülimalt kasulikuks. Samuti on bioinformaatikas veel hulk andmestikke, kus konvolutsioonilised võrgud võivad osutuda efektiivsemaks kui senised meetodid. Loodame, et käesolev töö julgustab teadlasi tehisnärvivõrke proovima ka oma andmestikel.Artificial neural networks (ANNs) are a machine learning algorithm that has gained popularity in recent years. Different subtypes of ANNs are used in various fields of computer science. For example, convolutional networks are useful in object and face recognition systems; whereas recurrent neural networks are effective in speech recognition and natural language processing. However, these examples are not the only possible applications of neural nets - in this thesis we demonstrated the benefits of ANNs in analyzing two biological datasets. First, we investigated if based only on the information contained within a DNA snippet it is possible to predict if the snippet originates from a viral genome or not. Through two publications we demonstrated that machine learning algorithms can make this prediction. Convolutional neural networks (CNNs) proved to be the most accurate. The recommendation system created allows virologists to identify yet unknown viral species, which may have important effects on human health. The second biological dataset analyzed originates from neuroscience. In mammalian hippocampus there are so called place cells which activate only if the animal is in a specific location in space. We showed that recurrent neural networks (RNNs) allow to predict the animal’s location with ~10cm precision based on the activity of only a few dozen place cells. RNNs proved to be more effective than the most commonly used Bayesian methods. These networks use the past neuronal activity as a context that helps fine-tune the location predictions. Also in many other neural datasets the prior brain activity might reflect important information about the current behaviour. Hence, RNNs might turn out to be very useful in making sense of brain signals. Similarly, CNNs are likely to prove more efficient than the currently used methods on many other bioinformatics datasets. We hope this thesis encourages more scientists to try neural networks on their own datasets.https://www.ester.ee/record=b536839

DSpace at Tartu University Library

Sissejuhatava programmeerimise MOOCi õppijad: taustamuutujad, kaasatuse mustrid ja õpisooritus

Author: Feklistova Lidia
Publication venue
Publication date: 25/11/2022
Field of study

Väitekirja elektrooniline versioon ei sisalda publikatsiooneÜks võimalus personaalseks ja professionaalseks arenguks on osalemine vaba juurdepääsuga e-kursustel (ingl massive open online courses, MOOCs). MOOCide osalejatel on suurem autonoomia võrreldes traditsiooniliste klassiruumides toimuvate tundidega. Samuti arvestades suurt osalejate hulka ja nende erinevat tausta, on kõikide õppijate kaasatus (ingl engagement) õppeprotsessis MOOCide korraldajatele väljakutseks. Osalejate taustamuutujate (ingl background variables) mõju kaasatusele, mis omakorda võib mõjutada õpisooritust (ingl performance), on jätkuvalt alauuritud valdkond. Doktoritöö eesmärk oli uurida MOOCide osalejate taustamuutujaid ja nende mõju kursusele registreerumisele ning lõpetamise tõenäosusele, tuvastada lõpetajate seas käitumuslikke (ingl behavioural engagement) ja kognitiivseid (ingl cognitive engagement) kaasatuse rühmasid ning uurida neid taustamuutujate ja õpisoorituse osas. Uurimuse fookuses oli MOOC “Programmeerimisest maalähedaselt”. Selle MOOCi osalejate ja lõpetajate taustamuutujad võrreldi MOOCidega „Programmeerimise alused I“ ja „Programmeerimise alused II“. MOOCil “Programmeerimisest maalähedaselt” oli rohkem naisi ja neid, kelle haridustase oli madalam. Lõpetajate osas selgus, et põhifookuses olnud MOOCil, ei olnud statistiliselt olulist erinevust nais- ja meeslõpetajate osakaalu ning erinevate tööhõive staatuste vahel. Suurem lõpetajate osakaal oli magistrikraadiga lõpetajate hulgas. Väiksem lõpetajate osakaal oli nende õppijate puhul, kes ei ole varem programmeerimist õppinud. Samad tulemused lõpetajate kohta olid ka MOOCil “Programmeerimise alused I“. Uurides MOOCi “Programmeerimisest maalähedaselt” lõpetajate ja mittelõpetajate õpisooritust, selgus, et nad vajasid testi sooritamiseks keskmiselt sama palju katseid. Mittelõpetajatel oli programmeerimisülesannete lahenduste esitamiskordade arv suurem ja neil oli testipunktid madalamad. Lõpetajate käitumusliku ja kognitiivse kaasatuse analüüs näitas, et lõpetajad ei ole homogeenne rühm. Käitumusliku kaasatuse puhul eristati lähtudes tegevuste hulgast 4 rühma. Uurimuse tulemused näitasid, et MOOCil võivad olla lõpetajad, kes teevad kõiki tegevusi, aga ka need, kes teevad vaid mõnda tegevust. Kognitiivse kaasatuse korral eristus 5 rühma, mille puhul kasutati abiallikaid erineva sagedusega. Tulemused näitasid, et lõpetajate erinevat sagedust erinevate abiallikate kasutamisel võib pidada märgiks püsivast soovist MOOC edukalt läbida. Samuti selgus, et abiallikate kasutamise võib võtta aluseks kognitiivse kaasatuse tuvastamiseks ja mõõtmiseks MOOCidel. Lõpetajate taustamuutujad ja õpisooritused varieerusid eristatud rühmade vahel. Doktoritöös esitatud tulemused aitavad uurijatel paremini aru saada MOOCi fenomenist ja kursuste korraldajatel pakkuda tulevikus kulutõhusamaid MOOCe. Uurimistulemustest võib järeldada, et MOOCide korraldajad peavad pakkuma erinevaid tegevusi ja abiallikaid, mis oleksid suunatud konkreetsetele sihtrühmadele. See võib hõlbustada personaliseeritud õppimist ja õppijate tõhusat kaasatust õppeprotsessis.One opportunity to facilitate personal and professional development is to participate in massive open online courses (MOOCs). MOOCs participants have greater autonomy compared to traditional physical classes. In addition, considering the huge number of participants and diversity of their backgrounds, it is a challenge for MOOCs instructors to engage them all in learning. The impact of background variables on engagement, which in turn may influence performance, remains understudied. The doctoral thesis aimed to study MOOCs participants’ background variables and their impact on course enrolment and completion probability, and explore different behavioural and cognitive engagement clusters among completers in terms of background variables and performance. The thesis focused on a MOOC “About Programming”. The MOOC participants’ and completers’ background variables were examined in comparison to MOOCs “Introduction to Programming I” and “Introduction to Programming II”. Females and those with a lower education level dominated in the MOOC “About Programming”. In this course, among completers there was no difference by gender and employment statuses. Master’s degree holders were more likely to complete the MOOC, while inexperienced in programming were less likely to complete it. The same results about completers were found in the MOOC “Introduction to Programming I”. With regard to performance, no difference between the MOOC “About programming” completers and non-completers in the average number of attempts per quiz was found. But non-completers made on average more attempts per programming task and received lower scores per quiz. The analysis of behavioural and cognitive engagement solely among completers indicated that they cannot be considered a homogeneous group. In terms of behavioural engagement, there were identified 4 groups based on the amount of activities a completer engaged with during the MOOC. The study results indicated that in a MOOC there can be completers who engage with all activities, as well as those who engage with only a few activities. In terms of cognitive engagement, there were identified 5 groups that were engaged with help sources at different frequency. The results indicated that the different frequency, with which completers use different help sources, can be considered as a sign of persistent desire to successfully complete the MOOC. In addition, it was revealed that the use of help sources can be applied as a basis for identifying and measuring cognitive engagement in the MOOC context. The background variables and performance of completers from different identified groups varied. The results of the thesis can prove quite beneficial to the scientific literature to understand the phenomenon of MOOC. This comprehension in terms of a variety of background variables, engagement patterns and performance can be helpful for course instructors to develop cost-effective MOOCs and provide personalised learning where different course activities and help sources can be targeted at specific groups. https://www.ester.ee/record=b552843

DSpace at Tartu University Library

Mitte-interaktiivsed nullteadmusprotokollid nõrgemate usalduseeldustega

Author: Abdolmaleki Behzad
Publication venue
Publication date: 09/07/2020
Field of study

Väitekirja elektrooniline versioon ei sisalda publikatsiooneTäieliku koosluskindlusega (TK) kinnitusskeemid ja nullteadmustõestused on ühed põhilisemad krüptograafilised primitiivid, millel on hulgaliselt päriselulisi rakendusi. (TK) Kinnitusskeem võimaldab osapoolel arvutada salajasest sõnumist kinnituse ja hiljem see verifitseeritaval viisil avada. Täieliku koosluskindlusega protokolle saab vabalt kombineerida teiste täieliku koosluskindlusega protokollidega ilma, et see mõjutaks nende turvalisust. Nullteadmustõestus on protokoll tõestaja ja verifitseerija vahel, mis võimaldab tõestajal veenda verifitseerijat mingi väite paikapidavuses ilma rohkema informatsiooni lekitamiseta. Nullteadmustõestused pakuvad suurt huvi ka praktilistes rakendustes, siinkohal on olulisemateks näideteks krüptorahad ja hajusandmebaasid üldisemalt. Siin on eriti asjakohased just lühidad mitteinteraktiivsed nullteadmustõestused (SNARKid) ning kvaasiadaptiivsed mitteinteraktiivsed nullteadmustõestused (QA-NIZKid). Mitteinteraktiivsetel nullteadmustõestustel juures on kaks suuremat praktilist nõrkust. Esiteks on tarvis usaldatud seadistusfaasi osapoolte ühisstringi genereerimiseks ja teiseks on tarvis täielikku koosluskindlust. Käesolevas doktoritöös me uurime neid probleeme ja pakume välja konkreetseid konstruktsioone nende leevendamiseks. Esmalt uurime me õõnestuskindlaid SNARKe juhu jaoks, kus seadistusfaasi ühisstring on õõnestatud. Me konstrueerime õõnestuskindla versiooni seni kõige tõhusamast SNARKist. Samuti uurime me QA-NIZKide õõnestuskindlust ja konstrueerime kõige efektiivsemate QA-NIZKide õõnestuskindla versiooni. Mis puutub teise uurimissuunda, nimelt täielikku koosluskindlusesse, siis sel suunal kasutame me pidevaid projektiivseid räsifunktsioone. Me pakume välja uue primitiivi, kus eelmainitud räsifunktsioonid on avalikult verifitseeritavad. Nende abil me konstrueerime seni kõige tõhusama mitteinteraktiivse koosluskindla kinnitusskeemi. Lõpetuseks me töötame välja uue võtte koosluskindlate kinnitusskeemide jaoks, mis võimaldab ühisarvutuse abil luua nullteadmustõestuste ühisstringe.Quite central primitives in cryptographic protocols are (Universally composable (UC)) commitment schemes and zero-knowledge proofs that getting frequently employed in real-world applications. A (UC) commitment scheme enables a committer to compute a commitment to a secret message, and later open it in a verifiable manner (UC protocols can seamlessly be combined with other UC protocols and primitives while the entire protocol remains secure). A zero-knowledge proof is a protocol usually between a prover and a verifier that allows the prover to convince the verifier of the legality of a statement without disclosing any more information. Zero-knowledge proofs and in particular Succinct non-interactive zero-knowledge proofs (SNARKs) and quasi adaptive NIZK (QA-NIZK) are of particular interest in the real-world applications, with cryptocurrencies or more generally distributed ledger technologies being the prime examples. The two serious issues and the main drawbacks of the practical usage of NIZKs are (i) the demand for a trusted setup for generating the common reference string (CRS) and (ii) providing the UC security. In this thesis, we essentially investigate the aforementioned issues and propose concrete constructions for them. We first investigate subversion SNARKs (Sub zk-SNARKs) when the CRS is subverted. In particular, we build a subversion of the most efficient SNARKs. Then we initiate the study of subversion QA-NIZK (Sub-QA-NIZK) and construct subversion of the most efficient QA-NIZKs. For the second issue, providing UC-security, we first using hash proof systems or smooth projective hash functions (SPHFs), we introduce a new cryptographic primitive called publicly computable SPHFs (PC-SPHFs) and construct the currently most efficient non-interactive UC-secure commitment. Finally, we develop a new technique for constructing UC-secure commitments schemes that enables one to generate CRS of NIZKs by using MPC in a UC-secure mannerhttps://www.ester.ee/record=b535926

DSpace at Tartu University Library

Kano-sarnase mudeli kasutamine avatud innovatsiooni saavutamiseks nõuete analüüsi protsessis

Author: Yin Huishi
Publication venue
Publication date: 01/11/2019
Field of study

Kui viiakse läbi nõuete analüüsi (inglise k Requirements Engineering, lühend RE), siis sageli järjestatakse nõuded nende olulisuse alusel (inglise k requirements prioritization), et saada selgust, milliste välja pakutud nõuetega funktsioon peaks tarkvaral olemas olema, seega sõltub tarkvara analüüsist tarkvara majandusliku väärtuse suurendamisega seotud otsuste tegemine. Tänapäeval arenevad tooted väga kiiresti ning ka nõuete olulisuse alusel järjestamine (inglise k requirements prioritization) on muutunud kiiremaks. Ettevõtted sooviksid saada kasutajatelt kiiret tagasisidet selle kohta, mis peaks olema järgmises mudelis olemas. Üks häid lahendusi sellele on Kano mudel (inglise k Kano model). Kano mudel selgitab välja kasutajate rahulolu ja toodete tunnuste vahelise suhte. See meetod liigitab kasutajate eelistused nende tähtsuse järjekorras, seega toetab see ka nõuete olulisuse järjekorra moodustamist. Aga Kano mudeli rakendamine on kallis ja aeganõudev ning seda ei saa kiiresti korrata. Veelgi enam – see mudel on keeruline väikeste ettevõtete jaoks, sest neil ei tarvitse olla piisavalt rahalisi jm vahendeid, et kasutajatega ühendust võtta ja neid intervjueerida. See omakorda paneb väikesed ettevõtted, eriti just idufirmad, ebavõrdsesse olukorda suurte ettevõtetega. Et sellele probleemile lahendust leida ja Kano mudeli kasutuselevõttu lihtsamaks ning odavamaks teha, arvame, et Kano mudelit tuleks arendada kahel viisil. Esiteks tuleks kasutada tasuta võrgus leiduvaid kirjalikke andmeid, mida saaks asendada intervjueeritavatelt kogutud vastustega. Teiseks – selleks, et hakkama saada võrgust kogutud kirjalike andmete suure mahuga, ning et kaasa aidata korrapärastele analüüsidele, peaks andmete analüüsimine olema automaatne. Selle uurimuse eesmärk on välja pakkuda meetodeid, et kasutajate avamusi, mis on võrgus saadavatest vabadest allikatest kogutud, (semi-)automaatselt liigitada, ja seda selleks, et aidata otsustajatel otsustada, millised tarkvara nõuded järgmises mudelis kindlasti olemas peaksid olema. Et seda uurimuse eesmärki saavutada, pakume me välja avatud innovatsiooni nõuete analüüsi (OIRE) meetodi, mille abil saavad tarkvarafirmad parema ülevaate kasutajate vajadustest ja sellest, kuivõrd rahul on nad olemasolevate toodetega.When Requirements Engineering (RE) is applied, requirements analysis is often used to determine which candidate requirements of a feature should be included in a software release. This plays a crucial role in the decisions made to increase the economic value of software. Nowadays, products evolve fast, and the process of requirements prioritization is becoming shorter as well. Companies benefit from receiving quick feedback from end users about what should be included in subsequent releases. One effective approach supporting requirements prioritization is the Kano model. The Kano model defines the relationship between user satisfaction and product features. It is a method used to classify user preferences according to their importance, and in doing so, supports requirements prioritization. However, implementing the Kano model is costly and time-consuming, and the application of the Kano model cannot be repeated quickly. Moreover, this is even more difficult for small companies because they might not have sufficient funds and resources to contact end users and conduct interviews. This puts small businesses, especially start-ups, at an unfair disadvantage in competing with big companies. To address this problem and make the application of the Kano model simpler, faster, and cheaper, we propose evolving the Kano model in two aspects. First, free online text data should be used to replace responses collected from interviewees. Second, in order to handle the higher amount of data that can be collected from free online text data and in order to facilitate frequent analyses, the data analysis process should be automated. The goal of this research is to propose methods for (semi-)automatically classifying user opinions collected from online open sources (e.g., from online reviews) to help decision-makers decide which software requirements to include in subsequent product versions. To achieve this research goal, we propose the Open Innovation in Requirements Engineering (OIRE) method to help software organizations gain a better understanding of user needs and satisfaction with existing products. A key element of the OIRE method is its Kano-like model. This Kano-like model mimics the traditional Kano model, except that it uses data from online reviews instead of interviews conducted with select focus groups.https://www.ester.ee/record=b527385

DSpace at Tartu University Library