21 research outputs found

    Generative Probabilistic Models of Biological and Social Network Data

    Get PDF
    Useat monimutkaiset systeemit voidaan esittää verkkona, jossa kaaret yhdistävät solmuja. Soluissa molekyylien, kuten proteiinien, vuorovaikutukset muodostavat verkon, ja sosiaalinen systeemi voi koostua yksittäisten toimijoiden suhteista. Verkkojen analysointi on kehittynyt pienen ihmisjoukon välisten suhteiden tutkimisesta valtavien monimutkaisten verkkojen, kuten Facebookin ja My- Spacen tapaisten kommunikaatioverkkojen tai solun laajuisten molekyyliverkkojen, analysointiin. Sen lisäksi, että käytännön verkot ovat erittäin suuria, ne ovat tyypillisesti harvoja ja epätäydellistä. Tällaisten verkkojen menestyksekäs analysointi vaatii kehittyneiden laskennallisten menetelmien käyttöä. Tämän diplomityön aiheena on uusi generatiivinen todennäköisyysmalliperhe, vuorovaikutuskomponenttimallit. Se on suunniteltu tiheästi kytkettyjen aliverkkojen löytämiseen kohinaisesta verkkodatasta. Tällaisilla aliverkoilla on monia tulkintoja käytännön sovelluksissa, kuten toiminnalliset geenimoduulit proteiinien vuorovaikutusverkoissa tai yhteisöt sosiaalisissa verkoissa. Malliperhe on suunniteltu mahdollisimman yksinkertaiseksi, jotta se olisi ymmärrettävä ja laskennallisesti toteutettavissa. Tässä työssä mallia sovelletaan uuteen ongelmaan, proteiinien vuorovaikutusverkkoihin, ja tavoitteena on löytää biologisesti järkeviä toiminnallisia moduuleita. Vaihtoehtoja mallin laajentamiseksi ymmärtämään myös verkkoja rikkaampaa dataa, kuten solmujen ominaisuuksia, esitellään ja kokeillaan. Tehdyissä kokeissa mallit löytävät tulkittavia klusterirakenteita verkoista useilla sovellusalueilla. Ehdotetut muutokset parantavat mallin suorituskykyä.Many complex systems can be represented as networks in which nodes are connected with edges. In cells, interactions between molecules, such as proteins, form a network, and social systems can consist of relationships between individual actors. Network analysis has developed from early studies of relationships between a small group of people to the analysis of huge complex networks, such as communication networks like Facebook and MySpace, or cell-wide biomolecular networks. In addition to being very large, the networks arising from real-world systems are typically sparse and contain missing and incomplete data. Successful analysis of such networks thus requires advanced computational methods. The topic of this thesis is a new generative probabilistic modeling framework, interaction component models, which is designed to detect densely connected subnetworks from noisy network data. Such subnetworks have many interpretations in practical applications, such as functional gene modules in protein interaction networks or communities in social networks. The model family is designed to be as simple as possible, to keep it understandable and computationally feasible. In this thesis, the model is applied to a new problem domain, namely protein interaction networks, in order to detect biologically relevant functional modules. Extensions to include additional data, such as attributes of the nodes, into the analysis are proposed and tested. Improvements to model inference are also introduced and their effect studied. In the experiments, models are able to find meaningful cluster structures from networks in several problem domains. The proposed modifications improve model performance

    Graph visualization with latent variable models

    Get PDF
    Large graph layout design by choosing locations for the vertices on the plane, such that the drawn set of edges is understandable, is a tough problem. The goal is ill-defined and usually both optimization and evaluation criteria are only very indirectly related to the goal. We suggest a new and surprisingly effective visualization principle: Position nodes such that nearby nodes have similar link distributions. Since their edges are similar by definition, the edges will become visually bundled and do not interfere. For the definition of similarity we use latent variable models which incorporate the user's assumption of what is important in the graph, and given the similarity construct the visualization with a suitable nonlinear projection method capable of maximizing the precision of the display. We finally show that the method outperforms alternative graph visualization methods empirically, and that at least in the special case of clustered data the method is able to properly abstract and visualize the links

    Äänenkorkeuden havaitsemisen hermostollinen perusta

    No full text

    Solutason lääkevasteiden ja molekyylivuorovaikutusten tilastollisia komponentteja

    No full text
    A fundamental question in medicine is how cancer and other complex diseases operate on the molecular level. Identifying the detailed mechanisms and interactions of how diseases progress and respond to drug treatments is essential for developing effective therapies. High-throughput molecular profiling technologies have provided vast amounts of measurement data of these phenomena. However, making sense of these masses of data is far from straightforward and requires advanced computational analysis methods. Probabilistic component models have been proven an effective tool in analysing and integrating high-dimensional and noisy molecular profiling data sources, such as gene expression. Such models can identify coherent components from the data, and interpreting these components provides insights about the underlying biological processes, such as disease progression and drug responses. In this thesis, probabilistic component models are applied and extended to identify and analyse molecular interaction and drug response patterns. Identifying functionally coherent gene modules from high-throughput measurements is a central task in many biomedical applications. In this thesis, an earlier component model for network data is extended for capturing functional modules from combinations of gene expression and protein interaction data. The identified modules provide hypotheses for novel molecular pathways and protein functions. High-throughput drug treatment measurements have made possible the detailed analysis of molecular drug responses and toxicity. In this thesis, probabilistic component models are applied to detect coherent drug response patterns from gene expression data. These patterns provide detailed insights to drug mechanisms of action and are highly applicable in cancer therapy development. Moreover, by associating the identified drug response components to toxicological outcomes, the first comprehensive view of molecular toxicogenomic responses is constructed with high performance in drug toxicity prediction.Syövän ja muiden monimutkaisten tautien molekyylitason mekanismien selvittäminen on keskeinen ongelma lääketieteessä. Tautien yksityiskohtaisten leviämismekanismien ja lääkevasteiden tunnistaminen on tärkeää tehokkaiden hoitomenetelmien kehityksessä. Näistä ilmiöistä on kerätty suuria molekyylitason aineistoja uusien mittausmenetelmien avulla. Näiden aineistojen tehokas hyödyntäminen vaatii kehittyneitä laskennallisia analyysimenetelmiä. Tilastolliset komponenttimallit ovat osoittautuneet tehokkaaksi työkaluksi suuriulotteisten ja kohinaisten mittausaineistojen, kuten geeniekspressiodatan, analysoinnissa ja yhdistämisessä. Tällaisilla malleilla datasta voidaan tunnistaa komponentteja, joita tulkitsemalla saadaan uuttaa tietoa biologisista prosesseista, kuten tautien etenemisestä ja lääkevasteista. Tässä väitöskirjatyössä tilastollisia komponenttimalleja sovelletaan molekyylien vuorovaikutusten ja lääkevasteiden tunnistamiseen ja analysointiin. Toiminnallisten geenimoduulien tunnistaminen suurista mittausaineistoista on keskeinen tehtävä monissa biolääketieteen sovelluksissa. Tässä väitöskirjatyössä aiempaa vuorovaikutuskomponenttimallia laajennetaan geenimoduulien tunnistamiseen geeniekspressio- ja proteiinien vuorovaikutusaineistoja yhdistämällä. Tunnistetut moduulit auttavat yksittäisten proteiinien ja niiden vuorovaikutusketjujen toiminnan selvittämisessä. Perimänlaajuiset lääkealtistusmittaukset ovat mahdollistaneet lääkevasteiden ja toksisuuden yksityiskohtaisen tutkimuksen. Tässä väitöskirjatyössä komponenttimalleilla haetaan säännönmukaisia lääkevasteita geeniekspressioaineistoista. Tunnistetut vasteet antavat uutta tietoa lääkkeiden vaikutuksista ja niitä voidaan käyttää uusien syöpähoitojen kehittämiseen. Hakemalla tilastollisia yhteyksiä geeniekspressiovasteiden ja toksisuusmittausten välillä saadaan lisäksi kokonaiskuva lääkkeiden toksisuuteen liittyvistä molekyylitason vasteista ja mahdollistetaan lääkkeiden toksisuuden tehokas ennustaminen

    Tiili-villa-tiili-ulkoseinärakenteen rakennusfysikaalinen toiminta

    Get PDF
    Rakennusten sisäilmaongelmat ovat saaneet viime vuosina paljon medianäkyvyyttä. Ongelmat ovat usein monien eri tekijöiden summa. Sisäilmaongelmien syntyyn myötävaikuttavat kuitenkin voimakkaasti rakenteiden kosteus- ja mikrobivauriot. Mikrobivauriot voivat vaikuttaa sisäilman laatuun heikentävästi siinä vaiheessa, kun vaurioituneen materiaalin ja sisäilman välillä on ilmayhteys, jota pitkin mikrobien aineenvaihduntatuotteet pääsevät siirtymään sisäilmaan rakennuksen ollessa alipaineinen ulkoilmaan nähden. Tässä tutkimuksessa tarkasteltiin pääosin tiili-villa-tiili-ulkoseinärakenteen kosteusteknistä toimintaa ideaalitilanteessa, jolloin rakenteen läpi ei oleteta tapahtuvan ilmavuotoja. Kyseisen ulkoseinärakenteen homehtumisherkkyyden kannalta kriittiseksi kohdaksi määriteltiin kirjallisuuskatsauksen ja laskentatarkastelujen perusteella ikkunoiden alapuolinen seinärakenne, joka yhtenäisestä ulkoseinärakenteesta poiketen sisältää orgaanista puumateriaalia ikkunan alapuolisen puurungon muodossa. Ikkunan alapuolisen ulkoseinärakenteen osalta selvitettiin rakenteen kosteusteknistä toimintaa rakenteen ominaisuuksien muuttuessa. Muuttujina käytettiin kirjallisuus-katsauksen ja kuntotutkimuksien pohjalta havaittuja rakenneratkaisuja. Laskentatarkasteluissa varioitiin tuuletusraon tukkeutumisastetta, tuuletusraon paksuutta, tiiliverhouksen ominaisuuksia, viistosateen tunkeutumista tiiliverhouksen läpi sekä mahdollisen tuulensuojavillan paksuutta. Ulkoseinärakenteen ominaisuuksien muuttumisen vaikutuksia rakenteen kosteustekniseen toi-mintaan arvioitiin Tampereen teknillisessä yliopistossa kehitetyllä rakenteiden kosteusteknisen toiminnan analysointimenetelmällä. Menetelmässä tarkastellaan rakenteiden lämpö- ja kosteusteknistä toimintaa rakennusfysikaalisten testivuosien olosuhteissa. Toimintakriteerinä rakenteen ominaisuuksien muuttuessa käytettiin Suomalaisen homemallin määrittelemää homeindeksiä. Tutkimuksessa tarkasteltiin myös ulkoseinärakenteen sisäkuoren ja ikkunakarmien läpi tapahtuvia ilmavuotoja erilaisilla rakennusvaipan yli vaikuttavilla paine-eroilla. Ilmavuotojen jakaantumista sisäkuoren läpi ja ikkunakarmien kautta tapahtuviin vuotoihin tarkasteltiin tilanteissa, joissa sisäkuoren ilmanläpäisevyys ja ikkunakarmeissa olevien rakojen mittasuhteet muuttuvat. Poten-tiaalia sisäilmaongelmien esiintymiselle arvioitiin laskennallisesti huomioiden tiili-villa-tiili–ulkoseinärakenteen kosteustekninen toiminta ja ilmavuotoreittien kautta siirtyvän ilman suuruus-luokka. Epäpuhtauksien kulkeutumisen arviointi perustuu kirjallisuuskatsaukseen, jossa on mallinnettu erikokoisten partikkeleiden tunkeutumista rakojen läpi muuttuvissa painesuhteissa. Tuloksien perusteella voidaan todeta vanhojen tiili-villa-tiili-ulkoseinärakenteiden kosteusteknisen toiminnan olevan heikkoa ja homekasvuston mahdollista tuuletusrakoon rajautuvissa ikkunan alapuolisissa puurungoissa. 2000-luvun alkupuolella rakenteessa yleistynyt tuulensuojavilla parantaa rakenteen kosteusteknisestä toimintaa merkittävästi. Kosteusteknistä toimintaa paran-taa merkittävästi myös tuuletusraon ilmanvaihtuvuuden paraneminen ja tuuletusraon kasvattaminen 20 mm:stä 40 mm:iin. Tulevaisuuden ilmastossa tiili-villa-tiili-ulkoseinärakenne säilyy kos-teusteknisesti toimivana, kun rakenteessa käytetään vähintään 50 mm paksua tuulensuojavillaa ja tuuletusraon ilmanvaihtuvuuteen ja erityisesti seinän alaosan tuuletusaukkojen avoimuuteen ja riittävyyteen kiinnitetään huomiota
    corecore