An integrated systems biology approach to investigate transcriptomic data of thyroid carcinoma

Abstract

Som følge av store framskritt i teknologi og innovativ tenkning har det blitt mulig å måle uttrykk av gener og hvordan dette uttrykket varierer over store grupper mennesker. Sammenligning av genuttrykk gjør det mulig å forske på komplekse sammenhenger mellom genuttrykk og sykdom. CSD-metoden er et rammeverk for å undersøke systematiske forskjeller i genetiske interaksjoner som er nyttig for å identifisere forskjellene som forårsaker sykdomsutvikling. I første del av denne oppgåven har vi sett på genuttrykk målt i skjoldbruskjertelen ved kreft. Skjortbrukskjertelkreft er den mest forekommende krefttypen blant de endokrine kjertlene. Det er en vanskelig kreft å bekjempe med nåværende behandlinger, og fører derfor ofte med seg dårlige sykdomsprognoser. På The Cancer Genome Atlas be genuttrykksprøver lasted ned og benyttet for å studere genuttrykksprofilen for denne krefttypen ved å sammenligne disse med prøver fra sunt vev. Med CSD-metoden greide vi å finne mange interessante genetiske korrelasjoner som framstilte et system med overpresentasjon for kreftrelaterte prosesser. Ved å se nærmere på disse, identifiserte vi potensielle kilder til feil i reguleringen av genuttrykk, for bland annet gener som er viktige i å koordinere ulike cellulære funksjoner som syntes å oppføre seg unormalt. Komparativ analyse av genuttrykk resulterte i nye kandidatgener som markører for skjoldbruskkjertelkreft. I den andre delen av oppgaven forsøkte vi å undersøke robustheten til CSD-metoden og finne mulige forbedringspotensialer. Kvalitetskontroll, inkludert korreksjon for kilder til forstyrrelser bland målinger i datasettene, viste seg å være viktig for å forsikre pålitelighet blant resultatene. En grunnleggende del av analysemetoder basert på samenfallende mønster i genuttrykk er å beregne korrelasjoner mellom uttykksmålingene. Her ble tre nye alternativer for å gjøre dette utforsket. Først ble vektet topologisk overlapp benyttet, og resulterte i et robust likhetsmål også for mindre datasett. Dette var spesielt nyttig for å finne interessante grupperinger av korrelerte gener. Den andre metoden var å beregne gjensidig informasjon, og besto i å implementere estimering av entropi. Denne viste seg å være mer avhengig av tilstrekkelig antall målepunkter men bidro til å belyse nye viktige genetiske interaksjoner som ikke de tidligere fremgangsmåtene fanget opp. En siste alternativ metode var en forenklet versjon av CSD-metoden, motivert av redusert beregningstid for anvendelse på store mengder genuttrykksmålinger. Dog denne lettere framgangsmetoden kan være preget av noen false positiver, vil den være nyttig i anvendelse på store sett med genuttrykksmålinger. For å evaluere kvaliteten til de utviklede metodene så vi på deres evne til å fremheve biologisk relevante genetiske interaksjoner. Alternative likhetsmål som utvidelser til CSDmetoden økte kunnskapen om skjoldbruskkjertelkreft og dro fram nye geninteraksjoner som kan bidra til å forstå sykdommen bedre samt å utvikle nye behandlinger i fremtiden

    Similar works

    Full text

    thumbnail-image