2 research outputs found
An谩lisis comparativo de clasificadores para la detecci贸n de subtipos de c谩ncer
En la actualidad el c谩ncer es una de las primeras causas de muerte a nivel mundial,
en la ingenier铆a el aprendizaje autom谩tico se est谩 utilizando para analizar datos y
aprender de ellos, consecuentemente son capaces de predecir o sugerir, y est谩
teniendo un alto impacto en los avances tecnol贸gicos m茅dicos. El objetivo de este
trabajo es realizar un an谩lisis comparativo para la detecci贸n de los subtipos de un
c谩ncer, la investigaci贸n inicia con la selecci贸n del tipo de c谩ncer, el cual se
seleccion贸 el c谩ncer de mama, posteriormente se caracteriz贸 los subtipos del
c谩ncer obteniendo 4 subtipos los cuales son, Luminal A, Luminal B, Basal o triple
negativo y el tipo de c谩ncer enriquecido con Her2. Posteriormente se realiz贸 la
clasificaci贸n siendo los clasificadores Support Vector Machines, K-Nearest
Neighbor y Naive Bayes los seleccionados, adem谩s se utilizaron los datos
obtenidos del bioproyecto GSE10886 que contiene 200 muestras de tejido
tumorosos generados en GEO2R (Herramienta que analiza datos gen贸micos). Los
resultados obtenidos de los indicadores precisi贸n, error, sensibilidad y
especificidad de los clasificadores son SVM (97%, 3%, 95%, 99%) , siendo el que
obtuvo mejor performance en comparaci贸n al clasificador KNN(88%, 12%, 89%,
96%) y del clasificador NB (90%, 10%, 89% y 98%) respectivamente, dem谩s se
obtuvo el tiempo de respuesta de la ejecuci贸n de los clasificadores siendo del
clasificador SVM 0.36 segundos, 2.79 segundos del clasificador KNN y 0.33
segundos del clasificador Naive Bayes. Finalmente se concluy贸 que el clasificador
que obtuvo mejor performance en los resultados evaluados es el clasificador SVM
con un 97% de precisi贸n, 3% de error , 95% de sensibilidad y un 99% de
especificidad y por 煤ltimo el clasificador con menos tiempo de respuesta fue el
clasificador Naive Bayes con 0.33 segundos.TesisInfraestructura, Tecnolog铆a y Medio Ambient
Variance-based Feature Selection for Classification of Cancer Subtypes Using Gene Expression Data
漏 2018 IEEE. Classification in cancer has traditionally relied on feature selection by differential expression as a first step, where genes are selected according to the strength of evidence for a consistent difference in expression level between classes. However, recent work has shown that many genes also differ in the variance of their gene expression between disease states, and in particular between cancers of different types, prognosis, or stages of development. Features selected based on increased variance in cancer or differences in variance between tumours of differing prognosis have been used to successfully predict tumour progression or prognosis within the same cancer type, and to classify cancer subtypes in cases where there is an overall increase in variance in one class over the other. Here, we apply feature selection by differential variance to the more general problem of classification of cancer subtypes. We show that classifiers using features selected by differential variance are able to distinguish between clinically relevant cancer subtypes, that these classifiers perform as well as classifiers based on features selected by differential expression, and that combining the two approaches often gives better classification results than either feature selection method alone