'Norwegian University of Science and Technology (NTNU) Library'
Abstract
Som følge av store framskritt i teknologi og innovativ tenkning har det blitt mulig å måle
uttrykk av gener og hvordan dette uttrykket varierer over store grupper mennesker. Sammenligning
av genuttrykk gjør det mulig å forske på komplekse sammenhenger mellom
genuttrykk og sykdom. CSD-metoden er et rammeverk for å undersøke systematiske forskjeller
i genetiske interaksjoner som er nyttig for å identifisere forskjellene som forårsaker
sykdomsutvikling. I første del av denne oppgåven har vi sett på genuttrykk målt i skjoldbruskjertelen
ved kreft. Skjortbrukskjertelkreft er den mest forekommende krefttypen blant
de endokrine kjertlene. Det er en vanskelig kreft å bekjempe med nåværende behandlinger,
og fører derfor ofte med seg dårlige sykdomsprognoser. På The Cancer Genome Atlas be
genuttrykksprøver lasted ned og benyttet for å studere genuttrykksprofilen for denne krefttypen
ved å sammenligne disse med prøver fra sunt vev. Med CSD-metoden greide vi å finne
mange interessante genetiske korrelasjoner som framstilte et system med overpresentasjon
for kreftrelaterte prosesser. Ved å se nærmere på disse, identifiserte vi potensielle kilder til
feil i reguleringen av genuttrykk, for bland annet gener som er viktige i å koordinere ulike
cellulære funksjoner som syntes å oppføre seg unormalt. Komparativ analyse av genuttrykk
resulterte i nye kandidatgener som markører for skjoldbruskkjertelkreft.
I den andre delen av oppgaven forsøkte vi å undersøke robustheten til CSD-metoden og finne
mulige forbedringspotensialer. Kvalitetskontroll, inkludert korreksjon for kilder til forstyrrelser
bland målinger i datasettene, viste seg å være viktig for å forsikre pålitelighet blant
resultatene. En grunnleggende del av analysemetoder basert på samenfallende mønster i genuttrykk
er å beregne korrelasjoner mellom uttykksmålingene. Her ble tre nye alternativer
for å gjøre dette utforsket. Først ble vektet topologisk overlapp benyttet, og resulterte i et
robust likhetsmål også for mindre datasett. Dette var spesielt nyttig for å finne interessante
grupperinger av korrelerte gener. Den andre metoden var å beregne gjensidig informasjon,
og besto i å implementere estimering av entropi. Denne viste seg å være mer avhengig av
tilstrekkelig antall målepunkter men bidro til å belyse nye viktige genetiske interaksjoner
som ikke de tidligere fremgangsmåtene fanget opp. En siste alternativ metode var en forenklet
versjon av CSD-metoden, motivert av redusert beregningstid for anvendelse på store
mengder genuttrykksmålinger. Dog denne lettere framgangsmetoden kan være preget av
noen false positiver, vil den være nyttig i anvendelse på store sett med genuttrykksmålinger.
For å evaluere kvaliteten til de utviklede metodene så vi på deres evne til å fremheve
biologisk relevante genetiske interaksjoner. Alternative likhetsmål som utvidelser til CSDmetoden
økte kunnskapen om skjoldbruskkjertelkreft og dro fram nye geninteraksjoner som
kan bidra til å forstå sykdommen bedre samt å utvikle nye behandlinger i fremtiden