2 research outputs found

    Immunomic and transcriptomic profiling of the immune response to gluten exposure in celiac disease

    Get PDF
    Celiac disease (CD) is an immune-mediated gastrointestinal disease that is precipitated by ingestion of dietary gluten, a protein found in wheat, barley and rye. The development of CD almost always requires genetic predisposition with the patients carrying either the DQ2 or DQ8 HLA-DQ alleles. As these genetic alleles are prevalent also in the healthy population, the main factors involved in CD pathogenesis, gluten and the genetic association, are necessary but not sufficient for CD development. Thus, the initial milieu of factors that lead to CD pathogenesis is still not completely understood, with current research suggesting other yet unidentified factors. The complexity of CD is also mirrored in its manifestation, with CD patients having symptoms ranging from gastrointestinal disorders to system-wide extra-intestinal manifestations, including skin and neurological conditions. It can also be asymptomatic. Consequently, CD misdiagnosis or late diagnosis is prevalent. Thus, further investigation of the immune response in CD is needed to better shed light on the intricacies of the cell and molecular changes involved, as well as to provide better diagnostic and therapeutic options. The advent and application of high throughput sequencing at the beginning of the last decade provided the opportunity to study the immune response in CD on an unprecedented scale. Particularly, with immune repertoire sequencing (RepSeq) and genome wide RNA sequencing (RNAseq), as well as the development of bioinformatics analysis methods, we considered the possibility of investigating the effect of gluten exposure in CD at a systemic level. The aim of this work was then to utilize RepSeq and RNAseq to characterize the global immunological and transcriptomic changes that occur in CD during in vivo gluten exposure. We also aimed to develop new computational methodologies for mining immune repertoire datasets to identify gluten associated T-cell receptor (TCR) clonotypes. At the beginning of our first study, which examined the global immune repertoire, there were few groundbreaking studies that had reported immunogenic gluten peptide-specific T-cell receptors in CD patients. However, as these studies used tetramer assays that allowed investigation of only a handful of gluten peptides at a time, they largely ignored the repertoire-wide immune response dynamics and the repertoire of T-cell receptors induced by gluten that may target not just gluten peptides but other antigens possibly relevant in CD. With study I, some of these shortcomings were addressed by using RepSeq to study the gluten-exposed global repertoire in the blood and gut of CD patients in an unbiased manner. The study showed that gluten exposure leads to increased TCR sharing in both blood and gut between unrelated CD patients, suggesting that the public component of the TCR immune response is important in CD. In addition, we identified particular TCR clonotypes that were induced by gluten exposure through the bioinformatics pipeline developed for differential abundance analysis in this study. The identified gluten-induced TCR clonotypes included novel as well as previously reported gluten-peptide binding TCRs, indicating that in spite of the immense diversity of the total immune repertoire, it was possible to utilize RepSeq to identify CD relevant clonotypes computationally without necessarily knowing their targeted antigen. In study I, the limited sharing of TCRs across individuals necessitated the comparison of TCR abundances within an individual (across different time points) or across-individuals, but only using the small set of public TCRs that were seen in multiple individuals. In study II, a comprehensive bioinformatic method that allows direct population level comparison of RepSeq datasets in two conditions for the identification of both public and private condition-associated TCRs was developed. The method relies on the assumption that private TCRs that are specific to an antigen, for example gluten peptide, are likely to have high similarity in their sequence to public TCRs targeting the same antigen and thus could be detected by proxy. It also assumes that such immune sequence components needed to mount an immune response to an antigen are likely to be shared across individuals, at least to a degree that may prove useful for computational identification. By dissecting the immune repertoire into clusters of TCRs with similar kmer composition and finding shared clusters of TCRs with similar kmer composition across individuals, the method facilitates the comparison of clonal abundances between condition groups and the identification of condition-relevant TCRs. The method was applied on CD RepSeq datasets from study I and successfully identified gluten-induced clonotypes, with TRBV-gene usage and positional amino acid usage patterns similar to known gluten-specific clonotypes. Overall, development of the method and its application on CD demonstrated that direct cross-individual comparison of immune repertoires for identification of disease relevant TCRs was possible, paving the way for direct investigation of the TCR immune response at the population-level, without necessarily knowing all the antigens targeted in an autoimmune disease like CD. In the final study, RNAseq was utilized to investigate the genome-wide transcriptional changes in the PBMC of CD patients, which showed that a short 3-day gluten exposure was enough to induce distinct transcriptional profile in patients. Importantly, this study identified genes with persistently altered expression and biological pathways with persistently perturbed regulation in CD patient PBMC, regardless of a long period of treatment with gluten-free diet. This study also suggested new candidate genes for known CD linked and/or associated genetic loci 19p13.11 and 21q22.3. In conclusion, this thesis developed new bioinformatic methods for the analysis of high throughput TCR immune repertoire datasets and the identification of condition-relevant clonotypes and applied the method on CD patient immune repertoires to identify gluten induced clonotypes. The thesis also provides several new insights into the global immune and transcriptional signatures associated with gluten exposure in CD. The methods and findings in this thesis have potential future use in CD disease stratification, diagnosis, therapy, and monitoring.Keliakia on immuunivälitteinen maha-suolikanavan sairaus, jonka aiheuttaa vehnässä, ohrassa ja rukiissa esiintyvä gluteeni. Keliakian kehittyminen vaatii melkein aina geneettisen alttiuden; potilaat kantavat joko HLA-DQ-geenin alleelia DQ2 tai DQ8. Koska nämä alleelit ovat yleisiä myös terveessä populaatiossa, tärkeimmät keliakian patogeneesiin liittyvät tekijät, gluteeni ja perintötekijät, ovat välttämättömiä, mutta eivät riittäviä keliakian kehittymiselle. Näin ollen kaikkia keliakian kehittymiseen johtavia tekijöitä ei vieläkään täysin ymmärretä, ja nykyiset tutkimukset viittaavat muihin, vielä tunnistamattomiin tekijöihin. Keliakian monimutkaisuus näkyy myös sen ilmenemismuodoissa: keliaakikoilla voi olla oireita aina maha-suolikanavan häiriöistä laajempiin suolen ulkopuolisiin ilmenemismuotoihin, mukaan lukien iho- ja neurologiset sairaudet. Tauti voi olla myös oireeton. Siten väärä tai viivästynyt diagnoosi on yleistä. Keliakian immuunivasteen lisätutkimusta tarvitaan, jotta voidaan paremmin selvittää siihen liittyviä monimutkaisia solu- ja molekyylimuutoksia sekä kehittää parempia diagnostisia ja terapeuttisia vaihtoehtoja. Uuden sukupolven sekvensointimenetelmien kehitys ja käyttö viime vuosikymmenen alussa on mahdollistanut keliakian immuunivasteen tutkimuksen ennennäkemättömässä mittakaavassa. Erityisesti immunorepertuaarisekvensointi (RepSeq), genomin laajuinen RNA-sekvensointi (RNAseq) sekä bioinformatiikan analyysimenetelmien kehittäminen mahdollisti tämän systemaattisen tutkimuksemme gluteenialtistuksen vaikutuksista keliakiassa. Tämän työn tavoitteena oli hyödyntää RepSeqiä ja RNAseq:ia löytämään ne immunologiset ja geeniekspressiotasojen muutokset, joita esiintyy keliakiassa in vivo gluteenialtistuksen aikana. Kehitimme myös uusia laskennallisia menetelmiä immunorepertuaaridatan louhintaan gluteenia tunnistavien T-solureseptorien (TCR) klonotyyppien tunnistamiseksi. Tutkimuksemme alussa keliakian immunogeenisistä gluteenispesifisistä T-solureseptoreista oli tehty vasta muutamia uraauurtavia tutkimuksia tetrameerimääritysten avulla, jotka kuitenkin mahdollistivat vain yksittäisten gluteenipeptidien tutkimisen kerrallaan. Siten ne jättivät suurelta osin huomiotta koko laajemman immuunivasteen dynamiikan ja gluteenin indusoimien T-solureseptorien repertuaarin, joka saattaa kohdistua gluteenipeptidien lisäksi myös muihin keliakian kannalta merkityksellisiin antigeeneihin. Osatyössä I tätä tutkittiin käyttämällä RepSeq menetelmää valikoimattomasti koko veren ja suoliston repertuaarikirjolle gluteenialtistuksen yhteydessä. Tutkimus osoitti, että gluteenialtistus johtaa potilaiden kesken samankaltaisten T-solureseptoreiden lisääntymiseen sekä veressä että suolistossa, mikä viittaa siihen, että TCR-immuunivasteen ns. julkinen komponentti on tärkeä keliakiassa. Lisäksi löysimme tiettyjä gluteenialtistuksen indusoimia TCR-klonotyyppejä käyttämällä kehittämäämme bioinformatiikan työkalua toisistaan poikkeavien klonotyyppimäärien tilastolliseen vertailuun. Tunnistetut gluteenin indusoimat TCR-klonotyypit sisälsivät sekä uusia, että aiemmin raportoituja gluteenipeptidejä sitovia reseptoreita. Tämä osoittaa, että koko repertuaarin valtavasta monimuotoisuudesta huolimatta RepSeqillä oli mahdollista tunnistaa keliakian kannalta merkityksellisiä klonotyyppejä laskennallisesti, ilman tarkkaa tietoa spesifisistä antigeeneistä. Tutkimuksessa I TCR-klonotyyppien identtisyys yksilöiden välillä mahdollisti TCR-määrien vertailun saman yksilön sisällä (eri ajankohtina) tai eri yksilöiden välillä, mutta analyyseissä käytettiin vain pientä joukkoa niitä julkisia T-solu-reseptoreita, jotka havaittiin useilla yksilöillä. Tutkimuksessa II kehitettiin kattava bioinformatiikan menetelmä, joka mahdollistaa Repseq-aineistojen suoran populaatiotason vertailun sekä julkisten että yksityisten tautiin tai altistukseen liittyvien T-solureseptoreiden tunnistamiseksi. Menetelmä perustuu oletukseen, että yksityiset reseptorit, jotka ovat spesifisiä antigeenille kuten gluteenipeptidille, ovat todennäköisesti sekvensseiltään samankaltaisia julkisten reseptorien kanssa, jotka kohdistuvat samaan antigeeniin, ja siten ne voidaan löytää sen perusteella. Menetelmässä oletetaan myös, että sellaiset immuunisekvenssikomponentit, joita tarvitaan immuunivasteen muodostamiseen antigeenille, jaetaan todennäköisesti yksilöiden kesken ainakin siinä määrin, että sitä voidaan hyödyntää laskennallisessa tunnistamisessa. Jakamalla immunorepertuaari TCR-klustereihin, joilla on samanlainen kmer-koostumus, ja löytämällä jaettuja TCR-klustereita, joilla on samanlainen kmer-koostumus, menetelmä mahdollistaa kloonimäärien vertailun ryhmien välillä ja esimerkiksi taudin tai altistuksen kannalta merkityksellisten TCR:ien tunnistamisen. Menetelmää sovellettiin keliakian RepSeq dataan tutkimuksesta I, ja sillä tunnistettiin onnistuneesti gluteenin indusoimia klonotyyppejä, joissa TRBV-geenin käyttö ja aminohappojen sijainnit olivat samanlaisia tunnettujen gluteenispesifisten klonotyyppien kanssa. Kaiken kaikkiaan menetelmän kehittäminen ja sen soveltaminen keliakiaan osoitti, että immuunorepertuaarien suora ristiinvertailu taudin kannalta merkityksellisten T-solureseptoreiden tunnistamiseksi oli mahdollista, mikä viitoittaa tietä TCR-immuunivasteen suoralle tutkimukselle populaatiotasolla ilman että kaikkia autoimmuunitautiin liittyviä antigeenejä tarvitsee tuntea. Viimeisessä osatyössä käytettiin RNAseq menetelmää genominlaajuisten transkriptiomuutosten tutkimiseen keliakia-potilaiden veren mononukleaarisoluissa. Tutkimus osoitti, että lyhyt kolmen päivän gluteenialtistus riitti indusoimaan selvän transkriptioprofiilin muutoksen potilailla. Tutkimuksessa tunnistettiin geenejä, joiden ilmentyminen oli pysyvästi muuttunutta, sekä biologisia reittejä, joiden säätely on pysyvästi häiriintynyt keliaakikoiden valkosoluissa, riippumatta pitkästä hoidosta gluteenittomalla ruokavaliolla. Tutkimus löysi myös uusia ehdokasgeenejä tunnetuille keliakiaan kytkeytyville ja/tai assosioituville geenilokuksille 19p13.11 ja 21q22.3. Yhteenvetona voidaan todeta, että väitöskirjatyössä kehitettiin uusia bioinformaattisia menetelmiä massiivisten TCR-immunorepertuaariaineistojen analysointiin ja esimerkiksi tautien kannalta merkittävien klonotyyppien tunnistamiseen, ja sovellettiin menetelmää keliakia-potilaiden immunorepertuaareihin gluteenin indusoimien klonotyyppien tunnistamiseksi. Väitöskirja tarjoaa myös useita uusia havaintoja keliakian gluteenialtistukseen liittyvistä immuuni- ja transkriptioprofiileista. Tämän väitöskirjatyön menetelmistä ja tuloksista on tulevaisuudessa potentiaalisesti hyötyä keliakian diagnosoinnissa, hoidossa ja seurannassa

    A Pitfall in Determining the Optimal Feature Subset Size

    No full text
    corecore