1 research outputs found
Clasificaci贸n de leucocitos en im谩genes microsc贸picas de frotis sangu铆neo usando machine learning y CNN
El problema principal de las formas actuales de realizar la clasificaci贸n de leucocitos es
que solo tenemos dos opciones m谩s comunes en el mercado, se utiliza una maquinaria de
alto coste para poder hacer el procedimiento de clasificaci贸n o un t茅cnico de laboratorio
lo tiene que hacer manualmente con una muestra y un microscopio.
El objetiv贸 de esta investigaci贸n es poder validar un tercer camino el cual utiliza
tecnolog铆as que tuvieron un gran avance recientemente en el mercado como lo son
machine learning (m谩s espec铆ficamente las Redes Neuronales Convolucionales) para la
creaci贸n de nuevas soluciones con Inteligencia Artificial.
Con este objetivo en mente se siguieron varios pasos. El primero es la identificaci贸n del
grado de error de los procesos manuales y automatizados. Para este objetivo, se realiza
un an谩lisis bibliogr谩fico y se determin贸 que el promedio de grado de error de los procesos
manuales y automatizados son de 18.33 % y 3.59 % respectivamente. Y para la
investigaci贸n se decidi贸 utilizar un grado de error m铆nimo de 5 %. La soluci贸n que
cumpli贸 con este valor seleccionado tiene garantizado ser una soluci贸n mejor que el
procedimiento manual y ser comparable con procedimientos automatizados realizados
por maquinaria especializada.
Para la obtenci贸n del dataset, el cual fue utilizado en los procesos de entrenamiento
validaci贸n y testeo de los modelos de redes neuronales, se decidi贸 utilizar datos de
investigaciones previas realizadas por entidades de diferentes partes del mundo y
publicados para su uso en investigaci贸n. Se utilizaron 4 fuentes de datos los cuales nos
dieron un dataset diverso de 37760 muestras.
Como el dataset obtenido ten铆a una deficiencia de pocas muestras de un tipo especifico
de leucocitos. Se decidi贸 utilizar la t茅cnica de preprocesamiento de datos llamada Data
Augmentation; el cual, usando variaciones de rotaci贸n, flip, iluminaci贸n (valor gamma)
y ruido gaussiano permiti贸 aumentar el n煤mero de muestras a 59877.
Se procedi贸 a realizar iteraciones para la detecci贸n de la estructura del modelo de red
neuronal convolucional. Durante estas iteraciones se decidi贸 utilizar t茅cnicas contra el
overfitting (el cual es uno de los principales problemas que pueden presentar las redes
neuronales). Las t茅cnicas las cuales se utilizaron fueron reducci贸n de complejidad de la
estructura de modelo, valores de regularizaci贸n y capas de DropOut (capas que eliminan aleatoriamente entradas de una capa oculta de la red neuronal). Todas estas t茅cnicas se
vieron efectivas ya que con su ayuda se logr贸 determinar un modelo el cual cumpl铆a con
nuestro grado de error m铆nimo.
El ultimo paso fue un proceso de testeo, en este paso se realizaron las pruebas de
predicci贸n de uno a uno, uso de la funci贸n de evaluaci贸n propio de la framework de keras,
generaci贸n de 129 dataset de 500 im谩genes cada uno para prode verificar resultado
obtenido con la funci贸n de evaluaci贸n previamente utilizado y generaci贸n de matriz de
confusi贸n para poder ver diferentes resultados de predicci贸n