The prognostic significance of tall cells and lymphocytes in papillary thyroid carcinoma : the use of deep learning algorithms

Abstract

Papillary thyroid carcinoma (PTC) is the most common thyroid cancer variant with an overall excellent prognosis. However, some histological subtypes demonstrate a more aggressive disease progression and thus require more attention from clinicians. The tall cell subtype of papillary thyroid carcinoma (TC-PTC) is one such subtype; it is characterized by the presence of tall epithelial cells, comprising approximately 30% of the tumor volume. These cells are three times taller than they are wide, and display nuclear features consistent with classical PTC. This definition, however, is challenging to adhere to by traditional microscopy, which results in large inter-observer variability between pathologists when diagnosing TC-PTC. The aim of this thesis was to study the tall cell (TC) threshold needed for an adverse outcome. We trained a deep learning (DL)-based algorithm for tall cell detection and scoring. The TC-algorithm detected TC areas with a sensitivity and specificity of 93.7% and 94.5%, respectively, and non-TC areas with a sensitivity and specificity of 90.3% and 94.1%, respectively, in the test set. The performance of the TC-algorithm was compared to visual TC scoring on an internal validation dataset. A higher TC score assessed by the TC-algorithm correlated with a reduced relapse-free survival (RFS) for 10%, 20%, and 30% TC thresholds. The visually assessed TC scores did not predict survival at any of the analyzed TC thresholds. The trained TC-algorithm was further externally validated using held-out multicenter PTC datasets, one originating from Auria Biobank, Turku, Finland, and the other from the University of Bern, Switzerland. In the external validation, the DL-based algorithm detected TC areas with a sensitivity and specificity of 90.6% and 88.5%, respectively, while the non-TC areas were detected with a sensitivity and specificity of 81.6% and 92.9%, respectively. In the external validation datasets, a higher TC score correlated with a reduction in relapse-free survival using a 20% and 30% TC threshold. Immune cells of the tumor microenvironment play an important role in the development and progression of cancers and may have either tumor promoting or suppressing effects. High numbers of tumor-infiltrating lymphocytes (TILs) have been associated with a favorable outcome in certain cancers such as breast and colon cancer, and have also been shown to correlate with a favorable prognosis in PTC. Quantifying TILs is routinely performed by visual evaluation and estimation using a traditional microscope, which is time-consuming and subject to inter- and intra-observer variability. In this thesis, we also trained a DL-based algorithm for segmenting TIL areas in PTC. We trained this model using a novel antibody-supervised learning approach with a pan-leukocyte CD45 antibody staining as ground truth, and applied the model to hematoxylin and eosin (HE)-stained tissue slides. Twelve PTC whole slide images (WSIs) were analyzed by the trained algorithm, which had an intersection over union of 0.82 for detecting TIL areas in HE-stained tissue slides when comparing the algorithm predictions to the ground truth anti-CD45 mask. Conclusively, the findings suggest that a DL-based algorithm approach can register and find TCs with high sensitivity and specificity, even in externally collected, independent datasets without any supportive training. An algorithm TC threshold of 30% correlated with a reduction in relapse-free survival, and is suggested to be used when diagnosing TC-PTC. All cases with a TC score above 10%, i.e., PTC with tall cell features, should be reported by the pathologist. We also conclude that the proposed method of generating antibody-supervised annotations using destain-restain immunohistochemistry-guided annotations resulted in highly accurate segmentation of TIL-rich areas in HE-stained tissue images.Papillaarinen karsinooma (PTC) on yleisin kilpirauhassyöpä. Sen ennuste on yleensä erinomainen. Jotkut PTC:n histologiset alatyypit ovat kuitenkin aggressiivisempia ja vaativat siksi erilaista hoitoa ja seurantaa. Korkeasoluinen alatyyppi (Tall cell-alatyyppi = TC-PTC) on tavallista PTC: tä agressiivisempi muoto. Määritelmän mukaan vähintään 30 % kasvainsoluista on kolme kertaa niin pitkiä kuin leveitä, mutta muut tumapiirteet kuten uurteet ja vakuolit vastaavat perinteistä PTC:n morfologiaa. Mikroskoopilla diagnosoitaessa TC-PTC:n piirteiden tarkka kvantitoiminen on epäluotettavaa, ja tämä johtaa merkittäviin patologien välisiin eroihin korkeasolujen määrää arvioitaessa. Tämän väitöskirjan tavoitteena oli tutkia korkeasolujen raja-arvon korrelaatiota potilaiden ennusteeseen kilpirauhassyövässä. Koulutimme syväoppimiseen (DL) perustuvan algoritmin korkeasolujen havaitsemiseen ja määrän arviointiin. TC-algoritmi tunnisti testisarjassa TC-alueet 93,7 % herkkyydellä ja 94,5 % tarkkuudella sekä ei-TC-alueet 90,3 % herkkyydellä ja 94,1 % tarkkuudella. TC-algoritmin tuloksia verrattiin visuaalisesti arvioituun TC-osuuteen sisäisessä validaatioaineistossa. TC-algoritmin antama TC-arvo korreloi lyhyempään uusiutumisvapaaseen selviytymiseen (RFS) 10 %, 20 % ja 30 %:n TC-kynnyksillä. Visuaalisesti arvioidut TC-osuudet eivät ennustaneet selviytymistä millään analysoiduista TC-kynnyksistä. Koulutettu TC-algoritmi validoitiin myös ulkopuolisilla PTC-aineistoilla, jotka olivat Auria Biopankista, Turusta sekä Bernin yliopistosta, Sveitsistä. Ulkoisessa validoinnissa DL-pohjainen algoritmi tunnisti TC-alueet 90,6 % herkkyydellä ja 88,5% tarkkuudella sekä ei-TC-alueet 81,6 % herkkyydellä ja 92,9 % tarkkuudella. Validointiaineistossa suuri TC-arvo korreloi epäsuotuisan RFS:n kanssa käytettäessä 20 % ja 30 %:n TC-kynnystä. Kasvaimen mikroympäristön immuunisoluilla on tärkeä rooli syövän kehityksessä ja etenemisessä ja ne voivat vaikuttaa joko kasvua edistävästi tai hillitsevästi. Lisääntynyt kasvaimen sisäisten lymfosyyttien (TILs) määrä on liitetty parempaan ennusteeseen esimerkiksi rinta- ja paksusuolisyövissä, mutta myös papillaarisessa kilpirauhaskarsinoomassa. TIL:ien määrän arvioiminen visuaalisesti mikroskoopilla on vastavasti epäluotettavaa ja väitöskirjan yhden osatyön tavoitteena oli kouluttaa syväoppimiseen perustava algoritmi TIL-alueiden segmentointiin PTC:ssä. Algoritmi perustui CD45-immunohistokemian (pan-leukosyytti) hyödyntämiseen TIL:ien opettamiseksi algoritmille hematoksyliini-eosiini-värjätyistä PTC-laseista. Kaksitoista PTC-tapausta analysoitiin koulutetulla TIL-algoritmilla. Algoritmin ”intersection over union” (IoU) oli 0,82, kun algoritmin ennusteita verrattiin immunohistokemiallisiin CD45-värjäyksiin. Yhteenvetona tuloksista voidaan todeta, että syväoppimiseen perustuvalla algoritmilla voidaan tunnistaa ja kvantitoida sekä korkeasolut että TIL:t papillaarisesta karsinoomasta. Korkeasolujen kynnysarvo 30 % korreloi taudin lyhentyneeseen uusiutumisaikaan ja sitä tulisi käyttää TC-PTC:n diagnostiikassa raja-arvona. Lisäksi kaikki tapaukset, joissa TC-osuus on yli 10 % (PTC, jossa on korkeasoluisia piirteitä), tulisi raportoida patologin toimesta. Väitöskirjan toisena päälöydöksenä totesimme, että immunohistokemiallisesti uudelleenvärjätyt kudosleikkeet soveltuvat erinomaisesti syväoppimiseen perustavan algoritmin kouluttamiseen, kuten TIL-rikkaiden alueiden segmentointiin HE-värjätyistä kudosleikkeistä

    Similar works