unknown

Statistical analysis tools for metabolic and genomic bacterial data

Abstract

This thesis introduces statistical analysis methods for two types of bacterial data: metabolic data produced by phenotype microarray technology, and genomic data produced by sequencing technologies. As both technologies produce vast amounts of data, as well as have special features, there is a need for bioinformatics tools that adequately process and analyze the information produced. Similar to all biomolecular data analyses, the interplay between biological components poses an additional challenge to the method development. A specific complication, regarding the metabolic data, is the lack of larger quantities of replicates due to the high expenses of performing the experiments. In terms of the sequence data, genome-wide analysis tools are desired, since such methods have not yet been widely developed for bacteria, even though they exist for eukaryotic genetics. The thesis briefly reviews the current methods, and introduces new approaches tackling the above mentioned problems.Tässä väitöskirjassa kehitetään uusia tilastollisia analysointimenetelmiä fenotyyppimikrosiru- sekä geenisekvenssidatalle, joista ensimmäinen kuvaa solujen aineenvaihdunnan aktiivisuutta ja jälkimmäinen avaa solun geneettisen koodin. Tilastollisia menetelmiä tarvitaan, kun kyseisillä mittaustekniikoilla tuotettua tietoa halutaan hyödyntää esimerkiksi lääketieteen tarpeisiin vaikkapa uusia hoitomuotoja kehitettäessä. Nykyaikaisille molekyylitason mittauslaitteille on ominaista, että ne tuottavat suuren määrän havaintoja. Lisäksi jokaiseen menetelmään liittyy omat erityispiirteensä, jotka on huomioitava dataa tulkittaessa. Esimerkiksi fenotyyppimikrosirudataa analysoitaessa on huomioitava datan moniulotteinen luonne: yhdellä kokeella voidaan tutkia tuhansia fenotyyppejä yli ajan. Tilastollisten menetelmien kehittämistä ja luotettavaa tilastollista testaamista vaikeuttavat lisäksi pienet toistomäärät sekä datan vähäinen saatavuus, mikä on puolestaan seurausta siitä, että fenotyyppimikrosiruteknologia on vielä melko tuntematon, vähän käytetty menetelmä, joka koetaan hankalaksi tulkita. Geenisekvenssejä analysoitaessa on puolestaan huomioitava esimerkiksi tutkittavan organismin erityispiirteet, sillä eri organismit poikkeavat toisistaan geneettisiltä ominaisuuksiltaan. Ihmisillä geneettisten ominaisuuksien yhteyttä moniin sairauksiin kuten syöpiin on tutkittu esimerkiksi koko genominlaajuisilla assosiaatioanalyysimenetelmillä. Tässä väitöskirjassa esittelemme bakteerien geenisekvenssien analysointia varten kehitetyn koko genominlaajuisen menetelmän, jolla voidaan esimerkiksi kartoittaa bakteerien antibioottiresistenssiin vaikuttavia geneettisiä tekijöitä

    Similar works