Mikrobiomiaineistojen analysointi CoDaCoRe-menetelmän avulla

Abstract

Mikrobiomiaineistot muodostuvat mikrobiominäytteissä havaittujen eri mikrobien lukumääristä. Aineistojen tyyppillisiä piirteitä ovat suuri dimensio, nollasolut sekä mikrobien lukumäärien jakaumien vinous. Lisäksi aineistojen voidaan ajatella olevan kompositionaalisia. Tämän tutkielman tavoitteena on esitellä vastikään julkaistu uusi menetelmä mikrobiomiaineistojen analysointiin, CoDaCoRe. CoDaCoRe-menetelmän tarkoituksena on tunnistaa mahdollisimman vähälukuiset (eli "harvat") kaksi mikrobien osajoukkoa, jotka ennustavat valittua vastemuuttujaa parhaiten. Optimaaliset osajoukot määritetään aineiston perusteella joko ns. balanssien tai yhdelmien avulla. Balanssit ja yhdelmät määritellään kahteen osajoukkoon kuuluvien mikrobien havaittujen lukumäärien suhteina. Tutkielman alussa kuvataan, kuinka mikrobiomiaineistot muodostuvat sekä niiden erityispiirteitä ja haasteita. Lisäksi esitellään mikrobikoostumuksen monimuotoisuutta kuvaavia indeksejä sekä sitä, miten biomarkkereita eli biologista ilmiötä ennustavia mikrobeja voidaan tunnistaa. CoDaCoRe-menetelmän vaiheet esitellään ensin teoreettisesti. Tämän jälkeen menetelmää sovelletaan mikrobiomiaineistoon, joka on kerätty FinnBrain-syntymäkohorttitutkimuksessa 2.5 kuukauden ikäisiltä vauvoilta. CoDaCoRe-menetelmän avulla voidaan tutkia sekä binääristä että jatkuvaa vastemuuttujaa. Binäärisenä eli kaksiarvoisena vasteena käytetään synnytystapaa (alatiesynnytys vs. sektio). Jatkuvana vastemuuttujana käytetään 30 kuukautisten lasten silmänliikkeemittauksista johdettua muuttujaa, joka mittaa, kuinka usein lapsi käänsi katseensa pois pelokkaista kasvokuvista. Tutkielman tulosten perusteella alatiesynnyttäneet ja sektiolla synnyttäneet erosivat toisistaan selkeästi löydettyjen osajoukkojen suhteen. Myös silmänliikemmuuttujan tapauksessa tunnistettiin osajoukkoja, jotka pystyivät ennustamaan vastemuuttujaa. Sekä binäärisen että jatkuvan vastemuuttujan kohdalla tutkittiin, miten hyvin tunnistetut osajoukot ennustivat uusia havaintoja. Yhdelmien ennustuskyky oli vain hieman parempi verrattuna balansseihin. Sensitiivisyysanalyysina tarkasteltiin optimointialgoritmin tarvitseman siemenluvun vaikutusta löydettyihin osajoukkoihin. Valitulla siemenluvulla oli vaikusta löydettyjen osajoukkojen sisältämiin mikrobeihin

    Similar works