18 research outputs found

    Reconocimiento de animales desde imágenes utilizando aprendizaje por transferencia

    Get PDF
    Automatic image-based recognition systems have been widely used to solve different computer vision tasks. In particular, animals' identification in farms is a research field of interest for the computer vision and the agriculture community. It is then necessary to develop robust and precise algorithms to support detection, recognition, and monitoring tasks to enhance farm management. Traditionally, deep learning approaches have been proposed to solve image-based detection tasks. Nonetheless, databases holding many instances are required to achieve competitive performances, not mentioning the hyperparameters tuning issues. In this paper, we propose a transfer learning approach for image-based animal recognition. We enhance a pre-trained Convolutional Neural Network model for animal classification from noisy and low-quality images. First, a dog vs. cat task is tested from the well-known CIFAR database. Further, a cow vs. no cow database is built to test our transfer learning approach. The achieved results show competitive classification performance using different types of architectures compared to state-of-the-art methodologies.Los sistemas de reconocimiento automático basados en imágenes se han utilizado ampliamente para resolver diferentes tareas de visión por computador. En particular, la identificación de animales en granjas es un campo de investigación de interés para comunidad relacionada con visión artificial y agricultura. En este sentido, es necesario desarrollar algoritmos robustos y precisos para respaldar las tareas de detección, reconocimiento y monitoreo, en aras de apoyar la gestión de granjas en agricultura. Tradicionalmente, se han propuesto enfoques de aprendizaje profundo para resolver tareas de detección basadas en imágenes. No obstante, se requieren de bases de datos con muchas instancias para lograr un rendimiento competitivo, sin mencionar los problemas de ajuste de los hiperparámetros. En este artículo, proponemos un enfoque de aprendizaje por transferencia para el reconocimiento de animales basado en imágenes. En particular, mejoramos un modelo de red neuronal convolucional previamente entrenado para la clasificación de animales a partir de imágenes ruidosas y de baja calidad. Primero, se prueba una tarea de perro contra gato a partir de la conocida base de datos CIFAR. Además, se crea una base de datos de vaca versus no vaca para probar nuestro enfoque de aprendizaje por transferencia. Los resultados obtenidos muestran un rendimiento de clasificación competitivo utilizando diferentes tipos de arquitecturas, en comparación con las metodologías actuales

    Reconocimiento de animales desde imágenes utilizando aprendizaje por transferencia

    Get PDF
    Automatic image-based recognition systems have been widely used to solve different computer vision tasks. In particular, animals' identification in farms is a research field of interest for the computer vision and the agriculture community. It is then necessary to develop robust and precise algorithms to support detection, recognition, and monitoring tasks to enhance farm management. Traditionally, deep learning approaches have been proposed to solve image-based detection tasks. Nonetheless, databases holding many instances are required to achieve competitive performances, not mentioning the hyperparameters tuning issues. In this paper, we propose a transfer learning approach for image-based animal recognition. We enhance a pre-trained Convolutional Neural Network model for animal classification from noisy and low-quality images. First, a dog vs. cat task is tested from the well-known CIFAR database. Further, a cow vs. no cow database is built to test our transfer learning approach. The achieved results show competitive classification performance using different types of architectures compared to state-of-the-art methodologies.Los sistemas de reconocimiento automático basados en imágenes se han utilizado ampliamente para resolver diferentes tareas de visión por computador. En particular, la identificación de animales en granjas es un campo de investigación de interés para comunidad relacionada con visión artificial y agricultura. En este sentido, es necesario desarrollar algoritmos robustos y precisos para respaldar las tareas de detección, reconocimiento y monitoreo, en aras de apoyar la gestión de granjas en agricultura. Tradicionalmente, se han propuesto enfoques de aprendizaje profundo para resolver tareas de detección basadas en imágenes. No obstante, se requieren de bases de datos con muchas instancias para lograr un rendimiento competitivo, sin mencionar los problemas de ajuste de los hiperparámetros. En este artículo, proponemos un enfoque de aprendizaje por transferencia para el reconocimiento de animales basado en imágenes. En particular, mejoramos un modelo de red neuronal convolucional previamente entrenado para la clasificación de animales a partir de imágenes ruidosas y de baja calidad. Primero, se prueba una tarea de perro contra gato a partir de la conocida base de datos CIFAR. Además, se crea una base de datos de vaca versus no vaca para probar nuestro enfoque de aprendizaje por transferencia. Los resultados obtenidos muestran un rendimiento de clasificación competitivo utilizando diferentes tipos de arquitecturas, en comparación con las metodologías actuales

    Centered Kernel Alignment Enhancing Neural Network Pretraining for MRI-Based Dementia Diagnosis

    Get PDF
    Dementia is a growing problem that affects elderly people worldwide. More accurate evaluation of dementia diagnosis can help during the medical examination. Several methods for computer-aided dementia diagnosis have been proposed using resonance imaging scans to discriminate between patients with Alzheimer’s disease (AD) or mild cognitive impairment (MCI) and healthy controls (NC). Nonetheless, the computer-aided diagnosis is especially challenging because of the heterogeneous and intermediate nature of MCI. We address the automated dementia diagnosis by introducing a novel supervised pretraining approach that takes advantage of the artificial neural network (ANN) for complex classification tasks. The proposal initializes an ANN based on linear projections to achieve more discriminating spaces. Such projections are estimated by maximizing the centered kernel alignment criterion that assesses the affinity between the resonance imaging data kernel matrix and the label target matrix. As a result, the performed linear embedding allows accounting for features that contribute the most to the MCI class discrimination. We compare the supervised pretraining approach to two unsupervised initialization methods (autoencoders and Principal Component Analysis) and against the best four performing classification methods of the 2014 CADDementia challenge. As a result, our proposal outperforms all the baselines (7% of classification accuracy and area under the receiver-operating-characteristic curve) at the time it reduces the class biasing

    Kernel-based Enhancement of General Stochastic Network for Supervised Learning

    Get PDF
    En los últimos años, han tenido lugar avances significativos en el análisis de datos de alta dimensión que permiten soportar una amplia cantidad de aplicaciones en sistemas de aprendizaje automático y procesamiento de señales entre otros. Sin embargo, es difícil de interpretar la información disponible debido a su complejidad y a la gran cantidad de características obtenidas. Los algoritmos de Aprendizaje Profundo o Deep Learning surgen como una herramienta que se ocupa de este tipo de problemas mediante la extracción de representaciones (abstracciones) a partir de los datos. Las redes neuronales artificiales basadas en algoritmos de aprendizaje profundo, es decir, las Redes Neuronales Profundas o Deep Neural Networks (DNN) emplean un enfoque de jerarquía de característica que aumenta la complejidad y la abstracción. Lo anterior hace a las DNNs capaces de manejar conjuntos de datos muy grandes, de alta dimensión con miles de millones de parámetros que pasan a través de funciones no lineales. Además, esto proporciona una mejor representación de los datos, lo que permite un aprendizaje más rápido y una clasificación más precisa. Sin embargo, las DNNs, así como la mayoría de las redes neuronales artificiales, siguen siendo vulnerables a sufrir un over-fitting o exceso de ajuste. Con respecto a esto, las funciones Kernel aparecen como un enfoque alternativo que, en primer lugar, ayuda al análisis de datos de alta dimensión permitiendo mejorar la representación y la interpretación de los datos para el apoyo a sistemas de procesamiento de señales y de aprendizaje automático. Por otra parte, los métodos basados en Kernel desarrollan soluciones que ofrecen mejores resultados mediante la adaptación del Kernel a un problema dado, el cual, permite combatir el problema de over-fitting presente en la etapa de aprendizaje de las redes neuronales profundas. En este estudio, proponemos un marco de representación de datos basado en funciones Kernel para mejorar el rendimiento de una especie de red neuronal profunda, llamada Red Estocástica General o Red Estocástica Generativa de aprendizaje supervisado. En concreto, el marco propuesto se divide en dos metodologías basadas en Kernel, que tienen por objeto mejorar el ajuste de parámetros de la red de acuerdo con las relaciones entre los datos. En primer lugar, se desarrolla un criterio de selección automática de la arquitectura de la red basado en funciones Kernel, que permita cuantificar el tamaño óptimo de la capa preservando la información de conjunta entrada-salida. Por lo tanto, el tamaño de la capa oculta resultante se destaca con el objetivo de favorecer el aprendizaje de las etapas de entrenamiento en la clasificación y tareas de reconocimiento de objetos. Este enfoque llamado Joint Spectrum permite la explotación de la similitud de datos conjunta para un conjunto de muestras de entrada dado. En segundo lugar, se introduce un enfoque pre-entrenamiento supervisado de la red que resalta la relación entre los estados ocultos y la información objetivo. Por lo tanto, se introduce un enfoque pre-entrenamiento supervisado basado en una función Kernel CKA para aprender una matriz de proyección, la cual codifica la información discriminante de los datos para obtener una representación oculta adecuada. Por lo tanto, buscamos un método de pre-entrenamiento que capta las variaciones principales de la distribución de entrada para apoyar la etapa de aprendizaje. Por último, una red estocástica generativa mejorada fue desarrollada para apoyar las tareas de aprendizaje supervisado. La propuesta considera las dos estrategias de sintonización de parámetros de la red basadas en funciones Kernel antes mencionadas, explotando sus principales propiedades. La red resultante destaca dependencias de los datos relevantes y el conocimiento previo del usuario (información supervisada). Por lo tanto, se construye una red generalizable capaz de capturar una gran cantidad de información a partir de la distribución de datos de entrada y codificar patrones discriminantes. A lo largo de este estudio, el mejoramiento de red propuesto usando un marco basado en el Kernel se aplica a los datos de imagen como una alternativa para apoyar los sistemas de clasificación y análisis de objetos basado en la imagen. De hecho, el marco basado en funciones Kernel introducido mejora, en la mayoría de los casos, el rendimiento en tareas de aprendizaje supervisado, apoyando el análisis de una gran cantidad de datos utilizando arquitecturas de aprendizaje profundoAbstract : In recent years, significant developments have been taking place in high-dimensional data analysis allowing to support a wide amount of applications in machine learning systems and signal processing among others. However, it is difficult to interpret the available information due to its complexity and a large amount of obtained features. Deep learning algorithms arise as a tool that deals this kind of issue by the extraction of representations (abstractions) from the data. Artificial neural networks based on deep learning algorithms, i.e., Deep Neural Networks (DNN) employ a feature hierarchy approach that increases complexity and abstraction. It makes DNN capable of handling very large, high-dimensional data sets with billions of parameters that pass through nonlinear functions. Besides, this provides a better representation, allowing faster learning and more accurate classification. However, DNNs as well as most of the artificial neural networks, are still vulnerable to Over-fitting. With respect to this, kernel functions appear as an alternative approach that in the first place, helps to high dimensional data analysis allowing enhancing representation and data interpretation, for supporting signal processing and machine learning systems. Moreover, kernel-based methods develop better-performing solutions by adapting the kernel to a given problem, which, allows dealing with over-fitting problem present in deep neural networks learning stage. In this study, we propose a data representation framework based on kernel functions to enhance the performance of a kind of Deep Neural Networks, called General Stochastic Networks in supervised learning systems. Namely, the proposed framework is divided in two kernel-based methodologies, which aim to enhance network parameter setting according to data relationships. First, we develop an automatic architecture selection criterion based on kernel functions, that allows quantifying the optimal layer size preserving the joint input-output information. Thus, resulting hidden layer size are highlighted aiming to favor learning training stages in classification and object recognition tasks. This approach named Joint spectrum allows exploiting the joint data similarity for a given input sample set. Second, we introduce a supervised network Pre-training approach that highlights the relationship between hidden states and target information. Thus, a supervised pre-training approach based on a CKA-based function is introduced to learn a projection matrix, which encodes discriminate information from data to get a suitably hidden representation. So, we seek a pre-training method that captures main variations from the input distribution to support learning stage. Finally, an enhanced General Stochastic Network was developed to support supervised learning tasks. The proposal considers two strategies network parameter setting based on kernel functions, above mentioned, exploiting its main properties. The resulting network highlights relevant data dependencies and the user prior knowledge (supervised information). Thus, a generalizable network able to capture a lot of information from input data distribution and encode discriminant patterns is built. Along this study, the proposed network improvement using a kernel-based framework is applied to image data as an alternative to support classification systems and image-based object analysis. In fact, the introduced kernel-based framework improve, in most of the cases, supervised learning performances, supporting the analysis of a large amount of data using deep learning architecturesMaestrí

    Marco de aprendizaje profundo con interpretabilidad mejorada para la clasificación de tareas de imaginación motora

    No full text
    graficas, tablasDeep learning (DL) allows models composed of multiple processing layers to learn representations of data with several levels of abstraction. These methods have improved state-of-the-art tasks like speech recognition, visual object identification, and many other fields. Regarding electroencephalographic (EEG) signals analysis, especially for the Motor Imagery (MI) paradigm, the availability of large data sets and advances in machine learning have led to the deployment of DL architectures, allowing the understanding of the information that may contain for brain functionality. However, these models suffer some limitations in practice: i) often DL models not integrate properly EEG spatial information with extracted time-frequency features, ii) the resulting inter and intra-subject variability, along with frequently available small datasets, significantly decreases the performance of EEG-based MI systems, and iii) DL models are treated as “black boxes” lacking physiological interpretability. In this Ph.D. thesis proposal, we pretend to solve these issues i) developing a Deep&Wide learning methodology using multi-view feature extraction, ii) proposing a coupling information strategy based on transfer learning including subject’s clinical data, and iii) developing a relevance analysis methodology that allows improving the interpretability of neural responses. The detailed methodology and its respective execution plan (schedule) to carry out these objectives are further described. In addition, we list the available computational resources necessary for the proposed implementation (Texto tomado de la fuente)El aprendizaje profundo (por sus siglas en inglés DL) permite que los modelos compuestos por múltiples capas de procesamiento aprendan representaciones de datos con varios niveles de abstracción. Estos métodos han mejorado tareas de vanguardia como el reconocimiento de voz, la identificación de objetos visuales y muchos otros campos. En cuanto al análisis de señales electroencefalográficas (EEG), especialmente para el paradigma de Imaginación Motora (por sus siglas en inglés MI), la disponibilidad de grandes conjuntos de datos y los avances en el aprendizaje automático han llevado al despliegue de arquitecturas DL, permitiendo la comprensión de la información que puede contener para la funcionalidad cerebral. Sin embargo, estos modelos sufren algunas limitaciones en la práctica: i) a menudo los modelos DL no integran correctamente la información espacial de EEG con las características extraídas de tiempo-frecuencia, ii) la alta variabilidad inter e intra-sujeto resultante, junto con los pequeños conjuntos de datos disponibles, disminuye significativamente el rendimiento de los sistemas MI a partir de registros EEG, y iii) los modelos DL se tratan como “cajas negras ” que carecen de interpretabilidad fisiológica. En esta propuesta de tesis, pretendemos resolver estos problemas i) desarrollando una metodolog´ıa de aprendizaje Deep&Wide utilizando extracción de características de múltiples dominios, ii) proponiendo una estrategia de acoplamiento de información basada en el aprendizaje de transferencia que incluye los datos clínicos del sujeto, y iii) desarrollando una metodología de análisis de relevancia que permita mejorar la interpretabilidad de las respuestas neuronales. La metodología detallada y su respectivo plan de ejecución (cronograma) para llevar a cabo estos objetivos de describe más adelante. Además, se reportan los recursos computacionales disponibles y necesarios para la implementación de esta propuesta.Minciencias a través de la convocatoria Doctorados Nacionales Conv. 785 -2017DoctoradoDoctor en IngenieríaInteligencia artificial y Machine LearningEléctrica, Electrónica, Automatización Y Telecomunicaciones.Sede Manizale

    Marco de aprendizaje profundo con interpretabilidad mejorada para la clasificación de tareas de imaginación motora

    No full text
    graficas, tablasDeep learning (DL) allows models composed of multiple processing layers to learn representations of data with several levels of abstraction. These methods have improved state-of-the-art tasks like speech recognition, visual object identification, and many other fields. Regarding electroencephalographic (EEG) signals analysis, especially for the Motor Imagery (MI) paradigm, the availability of large data sets and advances in machine learning have led to the deployment of DL architectures, allowing the understanding of the information that may contain for brain functionality. However, these models suffer some limitations in practice: i) often DL models not integrate properly EEG spatial information with extracted time-frequency features, ii) the resulting inter and intra-subject variability, along with frequently available small datasets, significantly decreases the performance of EEG-based MI systems, and iii) DL models are treated as “black boxes” lacking physiological interpretability. In this Ph.D. thesis proposal, we pretend to solve these issues i) developing a Deep&Wide learning methodology using multi-view feature extraction, ii) proposing a coupling information strategy based on transfer learning including subject’s clinical data, and iii) developing a relevance analysis methodology that allows improving the interpretability of neural responses. The detailed methodology and its respective execution plan (schedule) to carry out these objectives are further described. In addition, we list the available computational resources necessary for the proposed implementation (Texto tomado de la fuente)El aprendizaje profundo (por sus siglas en inglés DL) permite que los modelos compuestos por múltiples capas de procesamiento aprendan representaciones de datos con varios niveles de abstracción. Estos métodos han mejorado tareas de vanguardia como el reconocimiento de voz, la identificación de objetos visuales y muchos otros campos. En cuanto al análisis de señales electroencefalográficas (EEG), especialmente para el paradigma de Imaginación Motora (por sus siglas en inglés MI), la disponibilidad de grandes conjuntos de datos y los avances en el aprendizaje automático han llevado al despliegue de arquitecturas DL, permitiendo la comprensión de la información que puede contener para la funcionalidad cerebral. Sin embargo, estos modelos sufren algunas limitaciones en la práctica: i) a menudo los modelos DL no integran correctamente la información espacial de EEG con las características extraídas de tiempo-frecuencia, ii) la alta variabilidad inter e intra-sujeto resultante, junto con los pequeños conjuntos de datos disponibles, disminuye significativamente el rendimiento de los sistemas MI a partir de registros EEG, y iii) los modelos DL se tratan como “cajas negras ” que carecen de interpretabilidad fisiológica. En esta propuesta de tesis, pretendemos resolver estos problemas i) desarrollando una metodolog´ıa de aprendizaje Deep&Wide utilizando extracción de características de múltiples dominios, ii) proponiendo una estrategia de acoplamiento de información basada en el aprendizaje de transferencia que incluye los datos clínicos del sujeto, y iii) desarrollando una metodología de análisis de relevancia que permita mejorar la interpretabilidad de las respuestas neuronales. La metodología detallada y su respectivo plan de ejecución (cronograma) para llevar a cabo estos objetivos de describe más adelante. Además, se reportan los recursos computacionales disponibles y necesarios para la implementación de esta propuesta.Minciencias a través de la convocatoria Doctorados Nacionales Conv. 785 -2017DoctoradoDoctor en IngenieríaInteligencia artificial y Machine LearningEléctrica, Electrónica, Automatización Y Telecomunicaciones.Sede Manizale

    Business models for pre and postpartum care

    Get PDF
    Este trabajo trata de establecer una participación mediante un modelo de negocio, en el dinámico y cada vez mayor, mercado de salud colombiano, enfocado en la población materno perinatal en la zona nororiental de la ciudad de Bogotá, D.C. para el año 2022. Partiendo del reconocimiento de la necesidad de brindar educación y cuidados médicos y de salud confiables y de calidad a la mujer y su familia en los momentos del preparto y posparto. Máxime con los cambios culturales y sociales que se han generado con el cada vez mayor nivel educativo y adquisitivo de las mujeres, así como los cambios en los conceptos y dinámicas de familia. Favoreciendo el contacto emocional con el nuevo integrante de la familia y ayudando a resolver las inquietudes que se presentan en cuanto a los cambios físicos y emocionales de la madre y su entorno familiar, en el pre y el posparto, preparación y realización de la lactancia, los cuidados y la estimulación temprana del neonato con vinculación activa del padre y/o familia. Se realizó una revisión de los componentes normativos hoteleros y de salud, de mercado y financiero, que están involucrados en las propuestas de negocio: servicio domiciliario, hotel spa materno perinatal y/o la unión de las dos propuestas.This work seeks to establish via a business model, participation in the dynamic and ever-growing Colombian health market, focused on the maternal perinatal population of the north-eastern city of Bogotá D.C, for the year 2022. Taking into account the necessity to provide reliable and quality education and medical care to the woman and her family, both before and after giving birth. Also taking into careful consideration, the cultural and social changes experimented due to the increasing educational and acquisitive power of women, along with the changes in the dynamics and concept of family. Favoring the emotional contact with the new member of the family, and aiding to resolve the inquiries that appear regarding emotional and physical changes of the mother and her familiar surroundings, before and after birth, during the preparation and the lactation itself, the early cares and stimulation of the neonate with an active bonding from the father and/or the family. A review of the normative elements regarding hotels and health, as well as population and financial markets, since all these elements are involved in the business proposal: a maternal perinatal hotel spa, domiciliary service or the union of both proposals.Magíster en Administración en SaludMaestrí

    Enhanced Data Representation by Kernel Metric Learning for Dementia Diagnosis

    No full text
    Alzheimer's disease (AD) is the kind of dementia that affects the most people around the world. Therefore, an early identification supporting effective treatments is required to increase the life quality of a wide number of patients. Recently, computer-aided diagnosis tools for dementia using Magnetic Resonance Imaging scans have been successfully proposed to discriminate between patients with AD, mild cognitive impairment, and healthy controls. Most of the attention has been given to the clinical data, provided by initiatives as the ADNI, supporting reliable researches on intervention, prevention, and treatments of AD. Therefore, there is a need for improving the performance of classification machines. In this paper, we propose a kernel framework for learning metrics that enhances conventional machines and supports the diagnosis of dementia. Our framework aims at building discriminative spaces through the maximization of center kernel alignment function, aiming at improving the discrimination of the three considered neurological classes. The proposed metric learning performance is evaluated on the widely-known ADNI database using three supervised classification machines (k-nn, SVM and NNs) for multi-class and bi-class scenarios from structural MRIs. Specifically, from ADNI collection 286 AD patients, 379 MCI patients and 231 healthy controls are used for development and validation of our proposed metric learning framework. For the experimental validation, we split the data into two subsets: 30% of subjects used like a blindfolded assessment and 70% employed for parameter tuning. Then, in the preprocessing stage, each structural MRI scan a total of 310 morphological measurements are automatically extracted from by FreeSurfer software package and concatenated to build an input feature matrix. Obtained test performance results, show that including a supervised metric learning improves the compared baseline classifiers in both scenarios. In the multi-class scenario, we achieve the best performance (accuracy 60.1%) for pretrained 1-layered NN, and we obtain measures over 90% in the average for HC vs. AD task. From the machine learning point of view, our proposal enhances the classifier performance by building spaces with a better class separability. From the clinical application, our enhancement results in a more balanced performance in each class than the compared approaches from the CADDementia challenge by increasing the sensitivity of pathological groups and the specificity of healthy controls

    Image-Based Learning Using Gradient Class Activation Maps for Enhanced Physiological Interpretability of Motor Imagery Skills

    No full text
    Brain activity stimulated by the motor imagery paradigm (MI) is measured by Electroencephalography (EEG), which has several advantages to be implemented with the widely used Brain–Computer Interfaces (BCIs) technology. However, the substantial inter/intra variability of recorded data significantly influences individual skills on the achieved performance. This study explores the ability to distinguish between MI tasks and the interpretability of the brain’s ability to produce elicited mental responses with improved accuracy. We develop a Deep and Wide Convolutional Neuronal Network fed by a set of topoplots extracted from the multichannel EEG data. Further, we perform a visualization technique based on gradient-based class activation maps (namely, GradCam++) at different intervals along the MI paradigm timeline to account for intra-subject variability in neural responses over time. We also cluster the dynamic spatial representation of the extracted maps across the subject set to come to a deeper understanding of MI-BCI coordination skills. According to the results obtained from the evaluated GigaScience Database of motor-evoked potentials, the developed approach enhances the physiological explanation of motor imagery in aspects such as neural synchronization between rhythms, brain lateralization, and the ability to predict the MI onset responses and their evolution during training sessions
    corecore