164 research outputs found

    Skeletonization of sparse shapes using dynamic competitive neural networks

    Get PDF
    La detección de regiones y objetos en imágenes digitales es un tema de suma importancia en la resolución de numerosos problemas correspondientes al área de reconocimiento de patrones. En esta dirección los algoritmos de esqueletización son una herramienta muy utilizada ya que permiten reducir la cantidad de información disponible facilitando la extracción de características para su posterior reconocimiento y clasificación. Además, esta transformación de la información original en sus características esenciales, facilita la eliminación de ruidos locales presentes en la entrada de datos. Este artículo propone una nueva estrategia de esqueletización aplicable a imágenes esparcidas a partir de una red neuronal competitiva dinámica entrenada con el método AVGSOM. La estrategia desarrollada en este trabajo determina los arcos que forman el esqueleto combinando el aprendizaje no supervisado del AVGSOM con un árbol de dispersión mínima (minimun spaning tree). El método propuesto ha sido aplicado en imágenes con diferente forma y grado de dispersión. En particular, los resultados obtenidos han sido comparados con soluciones existentes mostrando resultados satisfactorios. Finalmente se presentan algunas conclusiones así como algunas líneas de trabajo futurasThe detection of regions and objects in digital images is a topic of utmost importance for solving several problems related to the area of pattern recognition. In this direction, skeletonization algorithms are a widely used tool since they allow us to reduce the quantity of available data, easing the detection of characteristics for their recognition and classification. In addition, this transformation of the original data in its essential characteristics eases the elimination of local noise which is present in the data input. This paper proposes a new skeletonization strategy applicable to sparse images from a competitive, dynamic neural network trained with the AVGSOM method. The strategy developed in this paper determines the arc making up the skeleton combining AVGSOM non-supervised learning with a minimum spanning tree. The proposed method has been applied in images with different spanning shape and degree. In particular, the results obtained have been compared to existing solutions, showing successful results. Finally, some conclusions, together with some future lines of work, are presented.VII Workshop de Agentes y Sistemas Inteligentes (WASI)Red de Universidades con Carreras en Informática (RedUNCI

    Skeletonization of sparse shapes using dynamic competitive neural networks

    Get PDF
    La detección de regiones y objetos en imágenes digitales es un tema de suma importancia en la resolución de numerosos problemas correspondientes al área de reconocimiento de patrones. En esta dirección los algoritmos de esqueletización son una herramienta muy utilizada ya que permiten reducir la cantidad de información disponible facilitando la extracción de características para su posterior reconocimiento y clasificación. Además, esta transformación de la información original en sus características esenciales, facilita la eliminación de ruidos locales presentes en la entrada de datos. Este artículo propone una nueva estrategia de esqueletización aplicable a imágenes esparcidas a partir de una red neuronal competitiva dinámica entrenada con el método AVGSOM. La estrategia desarrollada en este trabajo determina los arcos que forman el esqueleto combinando el aprendizaje no supervisado del AVGSOM con un árbol de dispersión mínima (minimun spaning tree). El método propuesto ha sido aplicado en imágenes con diferente forma y grado de dispersión. En particular, los resultados obtenidos han sido comparados con soluciones existentes mostrando resultados satisfactorios. Finalmente se presentan algunas conclusiones así como algunas líneas de trabajo futurasThe detection of regions and objects in digital images is a topic of utmost importance for solving several problems related to the area of pattern recognition. In this direction, skeletonization algorithms are a widely used tool since they allow us to reduce the quantity of available data, easing the detection of characteristics for their recognition and classification. In addition, this transformation of the original data in its essential characteristics eases the elimination of local noise which is present in the data input. This paper proposes a new skeletonization strategy applicable to sparse images from a competitive, dynamic neural network trained with the AVGSOM method. The strategy developed in this paper determines the arc making up the skeleton combining AVGSOM non-supervised learning with a minimum spanning tree. The proposed method has been applied in images with different spanning shape and degree. In particular, the results obtained have been compared to existing solutions, showing successful results. Finally, some conclusions, together with some future lines of work, are presented.VII Workshop de Agentes y Sistemas Inteligentes (WASI)Red de Universidades con Carreras en Informática (RedUNCI

    Skeletonization of sparse shapes using dynamic competitive neural networks

    Get PDF
    The detection of regions and objects in digital images is a topic of utmost importance for solving several problems related to the area of pattern recognition. In this direction, skeletonization algorithms are a widely used tool since they allow us to reduce the quantity of available data, easing the detection of characteristics for their recognition and classification. In addition, this transformation of the original data in its essential characteristics eases the elimination of local noise which is present in the data input. This paper proposes a new skeletonization strategy applicable to sparse images from a competitive, dynamic neural network trained with the AVGSOM method. The strategy developed in this paper determines the arc making up the skeleton combining AVGSOM non-supervised learning with a minimum spanning tree. The proposed method has been applied in images with different spanning shape and degree. In particular, the results obtained have been compared to existing solutions, showing successful results. Finally, some conclusions, together with some future lines of work, are presented.Facultad de Informátic

    Shape analysis and description based on the isometric invariances of topological skeletonization

    Get PDF
    ilustracionesIn this dissertation, we explore the problem of how to describe the shape of an object in 2D and 3D with a set of features that are invariant to isometric transformations. We focus to based our approach on the well-known Medial Axis Transform and its topological properties. We aim to study two problems. The first is how to find a shape representation of a segmented object that exhibits rotation, translation, and reflection invariance. The second problem is how to build a machine learning pipeline that uses the isometric invariance of the shape representation to do both classification and retrieval. Our proposed solution demonstrates competitive results compared to state-of-the-art approaches. We based our shape representation on the medial axis transform (MAT), sometimes called the topological skeleton. Accepted and well-studied properties of the medial axis include: homotopy preservation, rotation invariance, mediality, one pixel thickness, and the ability to fully reconstruct the object. These properties make the MAT a suitable input to create shape features; however, several problems arise because not all skeletonization methods satisfy all the above-mentioned properties at the same time. In general, skeletons based on thinning approaches preserve topology but are noise sensitive and do not allow a proper reconstruction. They are also not invariant to rotations. Voronoi skeletons also preserve topology and are rotation invariant, but do not have information about the thickness of the object, making reconstruction impossible. The Voronoi skeleton is an approximation of the real skeleton. The denser the sampling of the boundary, the better the approximation; however, a denser sampling makes the Voronoi diagram more computationally expensive. In contrast, distance transform methods allow the reconstruction of the original object by providing the distance from every pixel in the skeleton to the boundary. Moreover, they exhibit an acceptable degree of the properties listed above, but noise sensitivity remains an issue. Therefore, we selected distance transform medial axis methods as our skeletonization strategy, and focused on creating a new noise-free approach to solve the contour noise problem. To effectively classify an object, or perform any other task with features based on its shape, the descriptor needs to be a normalized, compact form: Φ\Phi should map every shape Ω\Omega to the same vector space Rn\mathrm{R}^{n}. This is not possible with skeletonization methods because the skeletons of different objects have different numbers of branches and different numbers of points, even when they belong to the same category. Consequently, we developed a strategy to extract features from the skeleton through the map Φ\Phi, which we used as an input to a machine learning approach. After developing our method for robust skeletonization, the next step is to use such skeleton into the machine learning pipeline to classify object into previously defined categories. We developed a set of skeletal features that were used as input data to the machine learning architectures. We ran experiments on MPEG7 and ModelNet40 dataset to test our approach in both 2D and 3D. Our experiments show results comparable with the state-of-the-art in shape classification and retrieval. Our experiments also show that our pipeline and our skeletal features exhibit some degree of invariance to isometric transformations. In this study, we sought to design an isometric invariant shape descriptor through robust skeletonization enforced by a feature extraction pipeline that exploits such invariance through a machine learning methodology. We conducted a set of classification and retrieval experiments over well-known benchmarks to validate our proposed method. (Tomado de la fuente)En esta disertación se explora el problema de cómo describir la forma de un objeto en 2D y 3D con un conjunto de características que sean invariantes a transformaciones isométricas. La metodología propuesta en este documento se enfoca en la Transformada del Eje Medio (Medial Axis Transform) y sus propiedades topológicas. Nuestro objetivo es estudiar dos problemas. El primero es encontrar una representación matemática de la forma de un objeto que exhiba invarianza a las operaciones de rotación, translación y reflexión. El segundo problema es como construir un modelo de machine learning que use esas invarianzas para las tareas de clasificación y consulta de objetos a través de su forma. El método propuesto en esta tesis muestra resultados competitivos en comparación con otros métodos del estado del arte. En este trabajo basamos nuestra representación de forma en la transformada del eje medio, a veces llamada esqueleto topológico. Algunas propiedades conocidas y bien estudiadas de la transformada del eje medio son: conservación de la homotopía, invarianza a la rotación, su grosor consiste en un solo pixel (1D), y la habilidad para reconstruir el objeto original a través de ella. Estas propiedades hacen de la transformada del eje medio un punto de partida adecuado para crear características de forma. Sin embargo, en este punto surgen varios problemas dado que no todos los métodos de esqueletización satisfacen, al mismo tiempo, todas las propiedades mencionadas anteriormente. En general, los esqueletos basados en enfoques de erosión morfológica conservan la topología del objeto, pero son sensibles al ruido y no permiten una reconstrucción adecuada. Además, no son invariantes a las rotaciones. Otro método de esqueletización son los esqueletos de Voronoi. Los esqueletos de Voronoi también conservan la topología y son invariantes a la rotación, pero no tienen información sobre el grosor del objeto, lo que hace imposible su reconstrucción. Cuanto más denso sea el muestreo del contorno del objeto, mejor será la aproximación. Sin embargo, un muestreo más denso hace que el diagrama de Voronoi sea más costoso computacionalmente. Por el contrario, los métodos basados en la transformada de la distancia permiten la reconstrucción del objeto original, ya que proporcionan la distancia desde cada píxel del esqueleto hasta su punto más cercano en el contorno. Además, exhiben un grado aceptable de las propiedades enumeradas anteriormente, aunque la sensibilidad al ruido sigue siendo un problema. Por lo tanto, en este documento seleccionamos los métodos basados en la transformada de la distancia como nuestra estrategia de esqueletización, y nos enfocamos en crear un nuevo enfoque que resuelva el problema del ruido en el contorno. Para clasificar eficazmente un objeto o realizar cualquier otra tarea con características basadas en su forma, el descriptor debe ser compacto y estar normalizado: Φ\Phi debe relacionar cada forma Ω\Omega al mismo espacio vectorial Rn\mathrm{R}^{n}. Esto no es posible con los métodos de esqueletización en el estado del arte, porque los esqueletos de diferentes objetos tienen diferentes números de ramas y diferentes números de puntos incluso cuando pertenecen a la misma categoría. Consecuentemente, en nuestra propuesta desarrollamos una estrategia para extraer características del esqueleto a través de la función Φ\Phi, que usamos como entrada para un enfoque de aprendizaje automático. % TODO completar con resultados. Después de desarrollar nuestro método de esqueletización robusta, el siguiente paso es usar dicho esqueleto en un modelo de aprendizaje de máquina para clasificar el objeto en categorías previamente definidas. Para ello se desarrolló un conjunto de características basadas en el eje medio que se utilizaron como datos de entrada para la arquitectura de aprendizaje automático. Realizamos experimentos en los conjuntos de datos: MPEG7 y ModelNet40 para probar nuestro enfoque tanto en 2D como en 3D. Nuestros experimentos muestran resultados comparables con el estado del arte en clasificación y consulta de formas (retrieval). Nuestros experimentos también muestran que el modelo desarrollado junto con nuestras características basadas en el eje medio son invariantes a las transformaciones isométricas. (Tomado de la fuente)Beca para Doctorados Nacionales de Colciencias, convocatoria 725 de 2015DoctoradoDoctor en IngenieríaVisión por computadora y aprendizaje automátic

    Learning with Latent Representations of 3D Data: from Classical Methods to 3D Deep Learning

    Get PDF
    3D data contain rich information about the full geometry of objects or scenes. Learning tasks on them have always been considered as hard ones in the computer vision community due to their extreme high dimensionality. Hence, latent representations of 3D geometries are often used to lower the data dimensionality for better parameterization and easier computation. In this report, we make a brief review on those latent representations obtained via different methods including classical ones and the emerging neural learning-based ones. Furthermore, the nowadays widely used deep learning methods have also been more closely investigated regarding their applications on various 3D data formats. The possibility of combing those two kinds of methods has also been addressed

    Sistemas inteligentes basados en neurocomputación

    Get PDF
    Esta línea de investigación se centra en el estudio y desarrollo de Sistemas Inteligentes implementados a partir de mecanismos de adaptación basados en Neurocomputación. Interesa especialmente la transferencia de tecnología a las áreas de minería de datos, robótica evolutiva y procesamiento de imágenes digitales. Los temas centrales se encuentran relacionados con la investigación de nuevas estrategias basadas en redes neuronales a fin de poder representar la información disponible. Los resultados obtenidos han sido aplicados tanto a la Minería de Datos como al procesamiento digital de imágenes. En el área de la robótica evolutiva, el énfasis está puesto en el estudio, investigación y desarrollo de controladores basados en redes neuronales evolutivas, especialmente aplicados a situaciones cuya solución requiere del aprendizaje de estrategias. Se trabaja en el desarrollo de nuevos métodos para la resolución de problemas utilizando agentes capaces de percibir y actuar en entornos complejos cuyos resultados son aplicados directamente en esta área.Eje: Agentes y Sistemas InteligentesRed de Universidades con Carreras en Informática (RedUNCI

    Sistemas inteligentes basados en neurocomputación

    Get PDF
    Esta línea de investigación se centra en el estudio y desarrollo de Sistemas Inteligentes implementados a partir de mecanismos de adaptación basados en Neurocomputación. Interesa especialmente la transferencia de tecnología a las áreas de minería de datos, robótica evolutiva y procesamiento de imágenes digitales. Los temas centrales se encuentran relacionados con la investigación de nuevas estrategias basadas en redes neuronales a fin de poder representar la información disponible. Los resultados obtenidos han sido aplicados tanto a la Minería de Datos como al procesamiento digital de imágenes. En el área de la robótica evolutiva, el énfasis está puesto en el estudio, investigación y desarrollo de controladores basados en redes neuronales evolutivas, especialmente aplicados a situaciones cuya solución requiere del aprendizaje de estrategias. Se trabaja en el desarrollo de nuevos métodos para la resolución de problemas utilizando agentes capaces de percibir y actuar en entornos complejos cuyos resultados son aplicados directamente en esta área.Eje: Agentes y Sistemas InteligentesRed de Universidades con Carreras en Informática (RedUNCI
    corecore