44 research outputs found

    Dependency detection with similarity constraints

    Full text link
    Unsupervised two-view learning, or detection of dependencies between two paired data sets, is typically done by some variant of canonical correlation analysis (CCA). CCA searches for a linear projection for each view, such that the correlations between the projections are maximized. The solution is invariant to any linear transformation of either or both of the views; for tasks with small sample size such flexibility implies overfitting, which is even worse for more flexible nonparametric or kernel-based dependency discovery methods. We develop variants which reduce the degrees of freedom by assuming constraints on similarity of the projections in the two views. A particular example is provided by a cancer gene discovery application where chromosomal distance affects the dependencies between gene copy number and activity levels. Similarity constraints are shown to improve detection performance of known cancer genes.Comment: 9 pages, 3 figures. Appeared in proceedings of the 2009 IEEE International Workshop on Machine Learning for Signal Processing XIX (MLSP'09). Implementation of the method available at http://bioconductor.org/packages/devel/bioc/html/pint.htm

    Genomic and functional profiling of gastric cancer

    Get PDF
    Helicobacter pylori infection is a risk factor for gastric cancer, which is a major health issue worldwide. Gastric cancer has a poor prognosis due to the unnoticeable progression of the disease and surgery is the only available treatment in gastric cancer. Therefore, gastric cancer patients would greatly benefit from identifying biomarker genes that would improve diagnostic and prognostic prediction and provide targets for molecular therapies. DNA copy number amplifications are the hallmarks of cancers in various anatomical locations. Mechanisms of amplification predict that DNA double-strand breaks occur at the margins of the amplified region. The first objective of this thesis was to identify the genes that were differentially expressed in H. pylori infection as well as the transcription factors and signal transduction pathways that were associated with the gene expression changes. The second objective was to identify putative biomarker genes in gastric cancer with correlated expression and copy number, and the last objective was to characterize cancers based on DNA copy number amplifications. DNA microarrays, an in vitro model and real-time polymerase chain reaction were used to measure gene expression changes in H. pylori infected AGS cells. In order to identify the transcription factors and signal transduction pathways that were activated after H. pylori infection, gene expression profiling data from the H. pylori experiments and a bioinformatics approach accompanied by experimental validation were used. Genome-wide expression and copy number microarray analysis of clinical gastric cancer samples and immunohistochemistry on tissue microarray were used to identify putative gastric cancer genes. Data mining and machine learning techniques were applied to study amplifications in a cross-section of cancers. FOS and various stress response genes were regulated by H. pylori infection. H. pylori regulated genes were enriched in the chromosomal regions that are frequently changed in gastric cancer, suggesting that molecular pathways of gastric cancer and premalignant H. pylori infection that induces gastritis are interconnected. 16 transcription factors were identified as being associated with H. pylori infection induced changes in gene expression. NF-κB transcription factor and p50 and p65 subunits were verified using elecrophoretic mobility shift assays. ERBB2 and other genes located in 17q12- q21 were found to be up-regulated in association with copy number amplification in gastric cancer. Cancers with similar cell type and origin clustered together based on the genomic localization of the amplifications. Cancer genes and large genes were co-localized with amplified regions and fragile sites, telomeres, centromeres and light chromosome bands were enriched at the amplification boundaries. H. pylori activated transcription factors and signal transduction pathways function in cellular mechanisms that might be capable of promoting carcinogenesis of the stomach. Intestinal and diffuse type gastric cancers showed distinct molecular genetic profiles. Integration of gene expression and copy number microarray data allowed the identification of genes that might be involved in gastric carcinogenesis and have clinical relevance. Gene amplifications were demonstrated to be non-random genomic instabilities. Cell lineage, properties of precursor stem cells, tissue microenvironment and genomic map localization of specific oncogenes define the site specificity of DNA amplifications, whereas labile genomic features define the structures of amplicons. These conclusions suggest that the definition of genomic changes in cancer is based on the interplay between the cancer cell and the tumor microenvironment.Mahasyöpä on maailmanlaajuinen ongelma ja noin miljoona potilasta sairastuu mahasyöpään vuosittain. Helicobacter pylori infektio on keskeisin mahasyövän riskitekijä. Mahasyövässä on kaksi alatyyppi, intestinaalinen ja diffuusi, joilla on erilaiset biologiset ja kliiniset ominaisuudet. Mahasyövän korkea kuolleisuus johtuu siitä, että tautia ei diagnosoida ajoissa ja usein diagnoosivaiheen syöpä on pitkälle edennyt adenokarsinooma, johon eivät hoidot enää tehoa. Tästä johtuen mahasyöpäpotilaat hyötyisivät merkittävästi uusista molekylaarisista biomarkkereista, joita voitaisiin käyttää taudin todentamiseen, ennusteen määrittämiseen sekä kohdennettujen hoitojen kehittämisessä. DNA:n kopiolukumuutokset, monistumat ja häviämät, ovat keskeisiä tapahtumia syöpägeenien toiminnan aktivoinnissa ja syövän kehityksessä. Geenien kopioluvulla on yhteys niiden toimintaan ja monistumat lisäävät onkogeenien ilmentymistä ja häviämät estävät kasvaimenestogeenien toimintaa. Tutkimuksen tavoitteina oli 1) määritellä H. pylori infektion kohdegeenit ja geenien säätelyverkostot, 2) tunnistaa kliinisesti merkittäviä mahasyöpägeenejä sekä 3) kuvata DNA kopiolukumonistumien biologisia ja mekanistisia taustoja. H. pylori infektion kohdegeenejä tutkittiin in vitro mallin avulla, jossa AGS mahasyöpäsoluja stimuloitiin bakteereilla. Bakteeri-infektion aikasarjanäytteiden geeni-ilmentyminen profiloitiin DNA mikrosirujen avulla. DNA mikrosirut mahdollistavat tuhansien geenien samanaikaisen mittaamisen. Tutkimuksessa tunnistettiin 200 geeniä, joiden ilmentyminen muuttui koejärjestelyn aikana. Näistä 10 geenin muutokset varmistettiin kvantitatiivisellä PCR menetelmällä. H. pylori infektion ensisijainen kohdegeeni oli FOS, jonka ilmentyminen lisääntyi huomattavasti jo 30 minuutin bakteeristimulaation jälkeen. Lisäksi H. pylori infektio sääteli useiden stressivasteessa toimivien geenien aktiivisuutta. Tilastollinen analyysi paljasti, että H. pylori infektion vastegeenit sijaitsivat genomialueilla, joissa havaitaan useasti muutoksia mahasyövässä. H. pylori infektion kohdegeenejä luetaan kroonisen, vuosikymmeniä kestävän tartunnan aikana paljon. Geeniluenta avaa geenien pakkauksen ja altistaa ne DNA vaurioille ja aktiivisesti luetuille geenialueille syntyy DNA vaurioita todennäköisemmin kuin hiljaisille alueille. H. pylori pysyy infektoimansa solun pinnalla eikä mene solun sisään, joten isäntäsolun reaktio H. pylori bakteeri-infektioon välittyy signaalinvälitysreittien kautta. H. pylori infektion aktivoimia signalointitapahtumia solussa tutkittiin aikaisemman DNA mikrosirututkimuksen geeni-ilmentymisprofiilia ja bioinformatiikkamenetelmiä hyödyntäen. H. pylori infektion soluvastetta säätelevien geenien promoottorialueet haettiin Ensembl tietokannasta. Promoottori on geenin luentaa säätelevä DNA alue. Transkriptiotekijät ovat proteiineja, jotka toimivat geenien säätelyssä ja niiden sitoutumiskohdat kartoitettiin H. pylori vastegeenien promoottorialueilla. Kartoitusta tehostettiin vertailemalla ihmisen ja hiiren vastaavien geenien promoottorialueiden konservoitumista. Evoluutiossa konservoituneet kohdat promoottorissa ovat todennäköisesti toiminnallisia ja osallistuvat geenin säätelyyn. H. pylori infektion vasteen säätelyyn osallistuvat transkriptiotekijät määriteltiin vertailemalla niiden esiintymismääriä H. pylori infektion kohdegeenien promoottereissa ja satunnaisesti valitussa geenijoukossa. Esiintymiskeskiarvojen eron merkitystä tutkittiin tilastollisilla menetelmillä. Tutkimuksessa tunnistettiin 16 transkriptiotekijää, joiden sitoutumiskohdat olivat rikastuneet H. pylori infektion vastegeeneissä. NF-κB transkriptiotekijän sekä sen alayksiköiden p50 ja p65 aktivoituminen H. pylori infektion seurauksena varmistettiin EMSA menetelmällä. EMSA:lla mitataan tumaan siirtyvien transkriptiotekijöiden määrää käyttämällä transkriptiotekijän sitoutumiskohdan radioaktiivisesti leimattua DNA sekvenssiä sekä transkriptiotekijäproteiinin tunnistavaa vasta-ainetta. H. pylori infektion seurauksena aktivoituvien transkriptiotekijöiden sääteleviä signaalinvälitysreittejä kartoitettiin Biocarta tietokannasta haettujen reittitietojen avulla. H. pylori infektiossa amktivoituneet transkriptiotekijät ja signaalinvälitysreitit liittyvät syövän synnyn kannalta keskeisten toimintojen, mm. solunjakautumisen ja ohjelmoidun solukuoleman, säätelyyn. Kliinisesti merkittäviä kohdegeenejä tutkittiin kattavaa potilasaineistoa hyödyntäen. Tutkimukseen valittiin 38 potilasnäytettä (25 intestinaalisen ja 13 diffuusin tyypin näytettä) kliinisten tietojen ja näytteiden laadun perusteella. Näytteistä eristettiin sekä DNA että RNA ja geenien kopioluku ja ilmentyminen määriteltiin genominlaajuisia DNA mirkosirumenetelmiä hyödyntäen. Mahasyövän alatyypit luokiteltiin geenikopiolukumuutosten perusteella. Intestinal tyypin syöpiin liittyi ERBB2 geenin monistuma sekä 20q ja Xp kromosomialueiden kopioluvun lisääntyminen. Mahasyövän kohdegeenit määriteltiin yhdistämällä geenien kopioluvun ja ilmentymisen DNA mikrosirumittaustulokset. Geenit, joiden ilmentyminen on lisääntynyt kopiolukumonistuman seurauksena tai vähentynyt kopioluvun vähentymisen takia, tunnistettiin tilastollisilla menetelmillä. Tunnistimme125 mahasyövän kohdegeeniä. Keskeiset mahasyövän kohdegeenit, mm. ERBB2, sijaitsivat 17q12-q21 kromosomialueella. ERBB2 ja MUC1 proteiinien ilmentyminen varmistettiin kudosmikrosirua ja immunohistokemiaa käyttäen. Kudossiru on mikroskooppilasi, jolle on kiinnitetty useita kudosnäytteitä. Tutkimuksessa käytetty kudossiru sisälsi 78 mahasyöpänäytettä. Immunohistokemia-menetelmässä kudossirun mahasyöpänäytteet värjättiin vasta-aineilla. DNA kopiolukumonistumien biologisia ja mekanistisia taustoja tutkittiin kansainvälisistä julkaisuista kerätyn tiedon perusteella muodostetun tietokannan avulla. Tietokantaan oli koottu 95 eri syöpätyypin monistumat 893 tutkimuksesta, joissa oli käytetty vertailevaa genomista hybridisaatiota. Tietokannassa oli 4500 tapausta ja mittausten herkkyys oli kromosomijuovatasoa (n=393). Tutkimuksessa käytettiin tilastollisia koneoppimis-, todennäköisyysmallinnus- ja tiedonlouhintamenetelmiä. Tulokset osoittivat, että syntyhistorialtaan ja solutyypiltään samankaltaiset syövät muistuttivat monistumaprofiileiltaan toisiaan ja monistuma-alueet sijaitsevat yhtenevästi tunnettujen onkogeenien kanssa. Lisäksi tiedonlouhintaa sekä tietokoneavusteista mallinnusta hyödyntäen osoitettiin, että monistuma-alueiden reunoille on rikastunut fragiilikohtia, sentromeerejä, telomeerejä sekä geenirikkaita vaaleita kromosomijuovia. Nämä genomiatribuutit liittyvät oletettavasti monistuman syntymekanismiin ja ovat genomin heikkoja kohtia, jotka ovat alttiita DNA vaurioille. H. pylori infektion molekyylikohteet liittyvät soluprosesseihin, jotka voivat edistää syöpään johtavien muutosten syntyä. H. pylori infektion molekyylikohteet saattavat olla hyödyllisiä infektion ennusteen määrittelyssä sekä uusien syöpähoitojen kehittämisessä. Mahasyövän intestinaalinen ja diffuusi alatyyppi olivat molekyyliprofiileiltaan erilaisia ja tunnistetut kohdegeenit voivat olla biologisesti sekä kliinisesti merkittäviä.Tulevaisuudessa H. pylori infektion ja mahasyövän kohdegeenit tulee varmistaa muilla menetelmillä laajemmassa näyteaineistossa. DNA monistumat eivät olleet satunnaisia vaan liittyivät tiettyihin syöpätyyppeihin. Monistumien kohdespesifisyys määrittyi syöpäsolutyypin ja syövä biologisen taustan perusteella. Monistumien rakenne määrittyi genomin vaurioherkkien kohtien mukaan. Syöpien luokittelu molekyyliominaisuuksien ja geneettisten taustojen perusteella parantaa syövän hoidon kehittymistä

    Monogenic gene variants in lung transplant recipients with usual interstitial pneumonia

    Get PDF
    Aim The prevalence of monogenic disease-causing gene variants in lung transplant recipients with idiopathic pulmonary fibrosis is not fully known. Their impact on clinical outcomes before and after transplantation requires more evidence. Patients and methods We retrospectively performed sequence analysis of genes associated with pulmonary fibrosis in a cohort of 23 patients with histologically confirmed usual interstitial pneumonia that had previously undergone double lung transplantation. We evaluated the impact of confirmed molecular diagnoses on disease progression, clinical outcomes and incidence of acute rejection or chronic lung allograft dysfunction after transplantation. Results 15 patients out of 23 (65%) had a variant in a gene associated with interstitial lung disease. 11 patients (48%) received a molecular diagnosis, of which nine involved genes for telomerase function. Five diagnostic variants were found in the gene for Telomerase reverse transcriptase. Two of these variants, p.(Asp684Gly) and p.(Arg774*), seemed to be enriched in Finnish lung transplant recipients. Disease progression and the incidence of acute rejection and chronic lung allograft dysfunction was similar between patients with telomere-related disease and the rest of the study population. The incidence of renal or bone marrow insufficiency or skin malignancies did not differ between the groups. Conclusion Genetic variants are common in lung transplant recipients with pulmonary fibrosis and are most often related to telomerase function. A molecular diagnosis for telomeropathy does not seem to impact disease progression or the risk of complications or allograft dysfunction after transplantation.Peer reviewe

    High Expression of Complement Component 5 (C5) at Tumor Site Associates with Superior Survival in Ewing's Sarcoma Family of Tumour Patients

    Get PDF
    Background. Unlike in most adult-onset cancers, an association between typical paediatric neoplasms and inflammatory triggers is rare. We studied whether immune system-related genes are activated and have prognostic significance in Ewing's sarcoma family of tumors (ESFTs). Method. Data analysis was performed on gene expression profiles of 44 ESFT patients, 11 ESFT cell lines, and 18 normal skeletal muscle samples. Differential expression of 238 inflammation and 299 macrophage-related genes was analysed by t-test, and survival analysis was performed according to gene expression. Results. Inflammatory genes are activated in ESFT patient samples, as 38 of 238 (16%) inflammatory genes were upregulated (P < 0.001) when compared to cell lines. This inflammatory gene activation was characterized by significant enrichment of macrophage-related gene expression with 58 of 299 (19%) of genes upregulated (P < 0.001). High expression of complement component 5 (C5) correlated with better event-free (P = 0.01) and overall survival (P = 0.004) in a dose-dependent manner. C5 and its receptor C5aR1 expression was verified at protein level by immunohistochemistry on an independent ESFT tumour tissue microarray. Conclusion. Immune system-related gene activation is observed in ESFT patient samples, and prognostically significant inflammatory genes (C5, JAK1, and IL8) for ESFT were identified

    Accurate genetic diagnosis of Finnish pulmonary arterial hypertension patients using oligonucleotide-selective sequencing

    Get PDF
    The genetic basis of pulmonary arterial hypertension (PAH) among Finnish PAH patients is poorly understood. We adopted a novel-targeted next-generation sequencing (NGS) approach called Oligonucleotide-Selective Sequencing (OS-Seq) and developed a custom data analysis and interpretation pipeline to identify pathogenic base substitutions, insertions, and deletions in seven genes associated with PAH (BMPR2, BMPR1B, ACVRL1, ENG, SMAD9, CAV1, and KCNK3) from Finnish PAH patients. This study represents the first clinical study with OS-Seq technology on patients suffering from a rare genetic disorder. We analyzed DNA samples from 21 Finnish PAH patients, whose BMPR2 and ACVRL1 mutation status had been previously studied using Sanger sequencing. Our sequencing panel covered 100% of the targeted base pairs with >15× sequencing depth. Pathogenic base substitutions were identified in the BMPR2 gene in 29% of the Finnish PAH cases. Two of the pathogenic variant-positive patients had been previously tested negative using Sanger sequencing. No clinically significant variants were identified in the six other PAH genes. Our study validates the use of targeted OS-Seq for genetic diagnostics of PAH and revealed pathogenic variants that had been previously missed using Sanger sequencing.Peer reviewe

    DSP p.(Thr2104Glnfs*12) variant presents variably with early onset severe arrhythmias and left ventricular cardiomyopathy

    Get PDF
    Background Dilated cardiomyopathy (DCM) is a condition characterized by dilatation and systolic dysfunction of the left ventricle in the absence of severe coronary artery disease or abnormal loading conditions. Mutations in the titin (TTN) and lamin A/C (LMNA) genes are the two most significant contributors in familial DCM. Previously mutations in the desmoplakin (DSP) gene have been associated with arrhythmogenic right ventricular cardiomyopathy (ARVC) and more recently with DCM. Methods We describe the cardiac phenotype related to a DSP mutation which was identified in ten unrelated Finnish index patients using next-generation sequencing. Sanger sequencing was used to verify the presence of this DSP variant in the probands' relatives. Medical records were obtained, and clinical evaluation was performed. Results We identified DSP c.6310delA, p.(Thr2104Glnfs*12) variant in 17 individuals of which 11 (65%) fulfilled the DCM diagnostic criteria. This pathogenic variant presented with left ventricular dilatation, dysfunction and major ventricular arrhythmias. Two patients showed late gadolinium enhancement (LGE) and myocardial edema on cardiac magnetic resonance imaging (MRI) that may suggest inflammatory process at myocardium. Conclusions The patients diagnosed with DCM showed an arrhythmogenic phenotype as well as SCD at young age supporting the recently proposed concept of arrhythmogenic cardiomyopathy. This study also demonstrates relatively low penetrance of truncating DSP variant in the probands' family members by the age of 40. Further studies are needed to elucidate the possible relations between myocardial inflammation and pathogenic DSP variants.Peer reviewe
    corecore