Phenotypic heterogeneity of potentially curable non-small cell lung cancer: cohort study with cluster analysis

Abstract

Background: The Tumor, Node, Metastasis (TNM) staging system in non-small cell lung cancer (NSCLC) is currently the most reliable prognostic tool. However, significant differences in clinical course and outcome are observed among patients with apparent curable disease by TNM staging. A more elaborate classification system that simultaneously incorporates the various facets of NSCLC may help identify specific disease patterns, therefore providing a more reliable prediction of outcome. Objectives: 1) to classify patients with potentially curable NSCLC into distinct phenotypic groups using cluster analysis, a multivariate statistical technique. 2) To validate the clinical relevance of these phenotypic clusters by assessing their differences with regard to outcome. Methods: A review of prospectively-collected data from stage I-III NSCLC patients, seen in a single hospital-based centre between January 2004 and October 2010, was conducted. Multiple correspondence analysis (MCA) was applied on a number of baseline variables, and followed by hierarchical clustering using Ward's linkage method. . Overall and disease-free survival estimates were compared among clusters using Kaplan-Meier curves and Cox proportional hazards modeling. Results: The total cohort (n=367) and a surgical sub-cohort (n=169) of patients with early-stage surgically resected NSCLC were analysed. In the total cohort, four and three-cluster models were identified to classify the patients. Clusters were distinct from each other, mainly with respect to gender distribution, smoking status, disease stage, degree of histologic differentiation- and to some extent histologic subtype- tumour metabolic activity on PET, and thyroid transcription factor 1 staining on immunohistochemistry. The surgical sub-cohort was also best classified using four or three-cluster algorithms. Clusters were determined on the basis of the previously cited variables, as well as EGFR mutational status and microscopic vascular and visceral pleural invasion. Overall and disease-free survival estimates differed significantly among various clusters in both the total cohort and surgical sub-cohort. Adjustment for age did not affect results significantly. Conclusion: Cluster analysis allowed the identification of distinct NSCLC phenotypes that exhibit differences in disease presentation, clinical course and outcome.Contexte: La classification TNM dans le cancer bronchique non à petites cellules (CBNPC) est actuellement le meilleur outil pronostique. Cependant, une hétérogénéité significative quant à la présentation et l'évolution clinique de la maladie est observée chez les patients dont le stade est potentiellement curable. Un système de classification plus élaboré, incorporant de façon simultanée plusieurs aspects de la maladie, permettrait d'identifier certains profils distincts du CBNPC, et ainsi offrir une meilleure prédiction de l'évolution clinique. Objectifs : 1) Classifier les patients avec CPNPC en phénotypes distincts, à l'aide de l'analyse de partitionnement de données (APD)- une technique statistique multi-variée. 2) Valider la pertinence clinique de ces phénotypes en comparant l'évolution clinique de chacun. Méthodes : Une revue de données prospectives sur les patients avec CBNPC stades I- III, diagnostiqué entre Janvier 2004 et Octobre 2010, a été effectuée. L'analyse des correspondances multiples a été appliquée sur un ensemble de variables de base, et suivie d'une APD hiérarchique utilisant la méthode de Ward. Des analyses de survie ont été effectuées à l'aide de la technique Kaplan-Meier. Les paramètres de survie globale et de survie sans progression ont été comparés entre les différents phénotypes, en ayant recours au modèle à risques proportionnels de Cox. Résultats: La cohorte complète (n= 367), ainsi qu'une sous-cohorte chirurgicale (n=169), ont été analysés. Dans la cohorte complète, un modèle de partitionnement de données à 3 ou 4 groupes est illustré. Les phénotypes se distinguaient par la distribution des sexes, tabagisme, stade de la maladie, degré de différentiation- et parfois le sous-type histologique- activité métabolique de la tumeur, et l'expression du facteur de transcription thyroïdienne en analyse immunohistochimique. La sous-cohorte chirurgicale était également représentée par un modèle de partition en 3 ou 4 groupes, se démarquant par les facteurs décrits ci-haut, en plus du statut de l'EGFR et l'invasion microscopique vasculaire et de la plèvre viscérale. Les paramètres de survie globale et sans progression différaient de façon significative entre les phénotypes établis, et ce, dans les deux cohortes. L'ajustement pour l'âge n'a pas modifié les résultats de façon notable. Conclusion: L'APD permet l'identification de phénotypes distincts de CBNPC, ayant des différences importantes quant à la présentation et l'évolution clinique de la maladie

    Similar works

    Full text

    thumbnail-image

    Available Versions