17 research outputs found

    Taulukkomuotoisen datan talteenotto PDF dokumenteista

    No full text
    Tables are an intuitive and universally used way of presenting large sets of experimental results and research findings, and as such, they are the majority source of significant data in scientific publications. As no universal standardization exists for the format of the reported data and the table layouts, two highly flexible algorithms are created to (i) detect tables within documents and to (ii) recognize table column and row structures. These algorithms enable completely automated extraction of tabular data from PDF documents. PDF was chosen as the preferred target format for data extraction because of its popularity and the availability of research publications as natively digital PDF documents, almost without exceptions. The extracted data is made available in HTML and XML formats. These two formats were chosen because of their flexibility and ease of use for further processing. The software application that was created as a part of this thesis work enables future research to take full advantage of existing research and results, by enabling gathering of large volumes of data from various sources for a more profound statistical analysis

    Bionformatiikan menetelmä mutaatioiden patogeenisyyden analysointiin: tutkimuskohteena DNA polymeraasi gamma

    No full text
    Geneettisen testauksen kustannusten laskiessa, pullonkaulaksi saatavilla olevan tiedon hyödyntämiseen on muodostumassa tietämyksemme eri geneettisten variaatioiden ja mutaatioden merkityksestä. Jokaisella henkilöllä on satoja, yksilöllisiä variaatioita perimässään joiden vaikutuksia ei tunneta. Tilanteissa joissa perinöllisen sairauden syytä pyritään selvittämään geenitutkimuksen avulla nämä variaatiot pitää pystyä tunnistamaan joko merkityksettömiksi tai merkitysellisiksi taudin kannalta, jotta oikean diagnoosin tekeminen ja sopivien hoitometelmien valinta on mahdollista. Rakennebiologia ja bioinformatiikka tarjoavat monia keinoja mutaatioiden vaikutusten tarkasteluun. Tässä tutkimuksessa käytetään esimerkkinä DNA polymeraasi gammaa (Pol γ), joka on ainoa tunnettu entsyymi joka replikoi ja ylläpitää mitokondrionaalista DNA:ta. Pol γ tarjoaa uniikin tutkimuskohteen pistemutaatioiden vaikutuksille sen kriittisen toiminnalisuuden ja korvaavien mekanismien puuttumisen vuoksi. Pol γ:n tunnetun proteiinirakenteen, yli 700 hengen potilasaineiston ja mutaatioiden biokemiallisen karakterisoinnin avulla pystymme tuottamaan ennennäkemättömän tarkan kuvan mutaatioiden vaikutusmekanismeista ja ennustamaan sekä tunnettujen, että vielä tuntemattomien mutaatioiden vaikutusta taudin puhkeamiseen ja etenemiseen. Tämän tutkimuksen osana olemme kehittäneet uuden algoritmin proteiinien kolmiulotteisten rakenteiden tutkimukseen ja analysointiin, nimeltään StructureMapper. StructureMapper on skaalautuva, suurien aineistojen analysoitiin suunniteltu algoritmi, joka tarjoaa mahdollisuuksia analysoida esimerkikisi ennustusalgoritmien tulosten luotettavuutta, kokeellisen datan laatua, ja sitä voidaan hyödyntää myös mutaatioiden haitallisuuden ennustamisessa ja tutkimuksessa. Kaikkia tämän tutkimuksen osana tuotetuista menetelmistä ja työkaluista voidaan hyödyntää yleiskäyttöisesti proteiinien tutkimuksessa.Genetic testing is becoming more and more prevalent in the field of medicine. The bottleneck in making a diagnosis based on genetic information has shifted from being able to acquire the required information by sequencing the genome of a patient, to understanding the effects of the detected, unique variations in the DNA. Mutations in the DNA can affect proteins and their structure on many levels. In a clinical setting, being able to separate the benign mutations from the pathogenic is of utmost importance. DNA polymerase gamma (Pol γ) offers an intriguing study subject in the world of structural biology. It is the sole enzyme responsible for replicating mitochondrial DNA. Defects in its functionality can manifest with a wide variety of symptoms that are often due to single point mutations that affect its structure in a deleterious way. Through analysis of the structure of Pol γ, combined with over 700 available patient case reports and biochemical characterization of some of the mutations, we have gained an unprecedented view to the reasons behind the mutations that lead to pathogenicity and altered biological functionality of the Pol γ enzyme. As a result of this study we have developed a new algorithm, StructureMapper, for the analysis of three-dimensional protein structures. StructureMapper enables high-throughput analysis of protein tertiary structures in a wide variety of applications, including verification of prediction algorithm results, experimental data quality control, as well as mutation pathogenicity analysis. All of the tools and methods created and described in this study can be applied to any proteins

    Bionformatiikan menetelmä mutaatioiden patogeenisyyden analysointiin: tutkimuskohteena DNA polymeraasi gamma

    No full text
    Geneettisen testauksen kustannusten laskiessa, pullonkaulaksi saatavilla olevan tiedon hyödyntämiseen on muodostumassa tietämyksemme eri geneettisten variaatioiden ja mutaatioden merkityksestä. Jokaisella henkilöllä on satoja, yksilöllisiä variaatioita perimässään joiden vaikutuksia ei tunneta. Tilanteissa joissa perinöllisen sairauden syytä pyritään selvittämään geenitutkimuksen avulla nämä variaatiot pitää pystyä tunnistamaan joko merkityksettömiksi tai merkitysellisiksi taudin kannalta, jotta oikean diagnoosin tekeminen ja sopivien hoitometelmien valinta on mahdollista. Rakennebiologia ja bioinformatiikka tarjoavat monia keinoja mutaatioiden vaikutusten tarkasteluun. Tässä tutkimuksessa käytetään esimerkkinä DNA polymeraasi gammaa (Pol γ), joka on ainoa tunnettu entsyymi joka replikoi ja ylläpitää mitokondrionaalista DNA:ta. Pol γ tarjoaa uniikin tutkimuskohteen pistemutaatioiden vaikutuksille sen kriittisen toiminnalisuuden ja korvaavien mekanismien puuttumisen vuoksi. Pol γ:n tunnetun proteiinirakenteen, yli 700 hengen potilasaineiston ja mutaatioiden biokemiallisen karakterisoinnin avulla pystymme tuottamaan ennennäkemättömän tarkan kuvan mutaatioiden vaikutusmekanismeista ja ennustamaan sekä tunnettujen, että vielä tuntemattomien mutaatioiden vaikutusta taudin puhkeamiseen ja etenemiseen. Tämän tutkimuksen osana olemme kehittäneet uuden algoritmin proteiinien kolmiulotteisten rakenteiden tutkimukseen ja analysointiin, nimeltään StructureMapper. StructureMapper on skaalautuva, suurien aineistojen analysoitiin suunniteltu algoritmi, joka tarjoaa mahdollisuuksia analysoida esimerkikisi ennustusalgoritmien tulosten luotettavuutta, kokeellisen datan laatua, ja sitä voidaan hyödyntää myös mutaatioiden haitallisuuden ennustamisessa ja tutkimuksessa. Kaikkia tämän tutkimuksen osana tuotetuista menetelmistä ja työkaluista voidaan hyödyntää yleiskäyttöisesti proteiinien tutkimuksessa.Genetic testing is becoming more and more prevalent in the field of medicine. The bottleneck in making a diagnosis based on genetic information has shifted from being able to acquire the required information by sequencing the genome of a patient, to understanding the effects of the detected, unique variations in the DNA. Mutations in the DNA can affect proteins and their structure on many levels. In a clinical setting, being able to separate the benign mutations from the pathogenic is of utmost importance. DNA polymerase gamma (Pol γ) offers an intriguing study subject in the world of structural biology. It is the sole enzyme responsible for replicating mitochondrial DNA. Defects in its functionality can manifest with a wide variety of symptoms that are often due to single point mutations that affect its structure in a deleterious way. Through analysis of the structure of Pol γ, combined with over 700 available patient case reports and biochemical characterization of some of the mutations, we have gained an unprecedented view to the reasons behind the mutations that lead to pathogenicity and altered biological functionality of the Pol γ enzyme. As a result of this study we have developed a new algorithm, StructureMapper, for the analysis of three-dimensional protein structures. StructureMapper enables high-throughput analysis of protein tertiary structures in a wide variety of applications, including verification of prediction algorithm results, experimental data quality control, as well as mutation pathogenicity analysis. All of the tools and methods created and described in this study can be applied to any proteins

    A security analysis of a P2P incentive mechanisms for mobile devices

    No full text

    Pathogenicity in POLG syndromes : DNA polymerase gamma pathogenicity prediction server and database

    Get PDF
    DNA polymerase gamma (POLG) is the replicative polymerase responsible for maintaining mitochondrial DNA (mtDNA). Disorders related to its functionality are a major cause of mitochondrial disease. The clinical spectrum of POLG syndromes includes Alpers-Huttenlocher syndrome (AHS), childhood myocerebrohepatopathy spectrum (MCHS), myoclonic epilepsy myopathy sensory ataxia (MEMSA), the ataxia neuropathy spectrum (ANS) and progressive external ophthalmoplegia (PEO). We have collected all publicly available POLG-related patient data and analyzed it using our pathogenic clustering model to provide a new research and clinical tool in the form of an online server. The server evaluates the pathogenicity of both previously reported and novel mutations. There are currently 176 unique point mutations reported and found in mitochondrial patients in the gene encoding the catalytic subunit of POLG, POLG. The mutations are distributed nearly uniformly along the length of the primary amino acid sequence of the gene. Our analysis shows that most of the mutations are recessive, and that the reported dominant mutations cluster within the polymerase active site in the tertiary structure of the POLG enzyme. The POLG Pathogenicity Prediction Server (http://polg.bmb.msu.edu) is targeted at clinicians and scientists studying POLG disorders, and aims to provide the most current available information regarding the pathogenicity of POLG mutations

    Particle filter and smoother for indoor localization

    No full text
    We present a real-time particle filter for 2D and 3D hybrid indoor positioning. It uses wireless local area network (WLAN) based position measurements, step and turn detection from a hand-held inertial sensor unit, floor plan restrictions, altitude change measurements from barometer and possibly other measurements such as occasional GNSS fixes. We also present a particle smoother, which uses future measurements to improve the position estimate for non-real-time applications. A lightweight fallback filter is run in the background for initialization, divergence monitoring and possibly re-initialization. In real-data tests the particle filter is more accurate and consistent than the methods that do not use floor plans. An example is shown on how smoothing helps to improve the filter estimate. Moreover, a floor change case is presented, in which the filter is capable of detecting the floor change and improving the 2D accuracy using the floor change information.Peer reviewe
    corecore