Deep Learning System for the Automatic Classification of Normal and Dysplastic Peripheral Blood Cells as a Support Tool for the Diagnosis

Abstract

[eng] Clinical pathologists identify visually many morphological features to characterize the different normal cells, as well as the abnormal cell types whose presence in peripheral blood is the evidence of serious diseases. Disadvantages of visual morphological analysis are that it is time consuming, needs expertise to perform an objective review of the smears and is prone to inter-observer variability. Also, most of the morphological descriptions are given in qualitative terms and there is a lack of quantitative measures. The general objective of this thesis is the automatic recognition of normal and dysplastic cells circulating in blood in myelodysplastic syndromes using convolutional neural networks and digital image processing techniques. In order to accomplish this objective, this work starts with the design and development of a Mysql database to store information and images from patients and the development of a first classifier of four groups of cells, using convolutional neural networks as feature extractors. Then, a high- quality dataset of around 17,000 images of normal blood cells is compiled and used for the development of a recognition system of eight groups of blood cells. In this work, we compare two transfer learning approaches to find the best to classify the different cell types. In the second part of the thesis, a new convolutional neural network model for the diagnosis of myelodysplastic syndromes is developed. This model was validated by means of a proof of concept. It is considered among the first models that have been built for diagnosis support. The final work of the thesis is the integration of two convolutional networks in a modular system for the automatic classification of normal and abnormal cells. The methodology and models developed constitute a step forward to the implementation of a modular system to recognize automatically all cell types in a real setup in the laboratory.[spa] Los especialistas de laboratorio identifican visualmente muchas características morfológicas para identificar las diferentes células normales, así como los tipos de células anormales, cuya presencia en sangre periférica es evidencia de enfermedades graves. Algunas de las desventajas del análisis morfológico visual incluyen que toma mucho tiempo, necesita experiencia para realizar una revisión objetiva de los frotis y es propenso a la variabilidad entre observadores. Además, la mayoría de las descripciones morfológicas se proporcionan en términos cualitativos. Debido a lo expuesto anteriormente, es necesario establecer medidas cuantitativas. El objetivo general de esta tesis es el reconocimiento automático de células normales y células displásicas circulantes en sangre en síndromes mielodisplásicos mediante redes neuronales convolucionales y técnicas de procesamiento digital de imágenes. Para lograr este objetivo, este trabajo comenzó con el diseño y desarrollo de una base de datos Mysql para almacenar información e imágenes de pacientes y el desarrollo de un primer clasificador de cuatro grupos de células, utilizando redes neuronales convolucionales como extractores de características. Luego, se compila un conjunto de datos de alta calidad de alrededor de 17.000 imágenes de células sanguíneas normales y se utiliza para el desarrollo de un sistema de reconocimiento de ocho grupos de células sanguíneas. En este trabajo, comparamos dos enfoques de aprendizaje por transferencia para encontrar el mejor para clasificar los diferentes tipos de células. En la segunda parte de la tesis se desarrolla un nuevo modelo de red neuronal convolucional para el diagnóstico de síndromes mielodisplásicos. Este modelo fue validado mediante prueba de concepto. Se considera uno de los primeros modelos que se han construido para apoyar el diagnóstico. El trabajo final de la tesis es la integración de dos redes convolucionales en un sistema modular para la clasificación automática de células normales y anormales. La metodología y los modelos desarrollados constituyen un paso adelante hacia la implementación de un sistema modular para reconocer automáticamente todos los tipos de células en una configuración real en el laboratorio

    Similar works