9 research outputs found

    Relaxation labeling in stereo image matching

    Get PDF
    This paper outlines a method for solving the global stereovision matching problem using edge segments as the primitives. A relaxation scheme is the technique commonly used by existing methods to solve this problem. These techniques generally impose the following competing constraints: similarity, smoothness, ordering and uniqueness, and assume a bound on the disparity range. The smoothness constraint is basic in the relaxation process. We have verified that the smoothness and ordering constraints can be violated by objects close to the cameras and that the setting of the disparity limit is a serious problem. This problem also arises when repetitive structures appear in the scene (i.e. complex images), where the existing methods produce a high number of failures. We develop our approach from a relaxation labeling method ([1] W.J. Christmas, J. Kittler, M. Petrou, structural matching in computer vision using probabilistic relaxation, IEEE Trans. Pattern Anal. Mach. Intell. 17(8)(1995) 749-764), which allows us to map the above constraints. The main contribution is made, (1) by applying a learning strategy in the similarity constraint and (2) by introducing specific conditions to overcome the violation of the smoothness constraint and to avoid the serious problem produced by the required fixation of a disparity limit. Consequently, we improve the stereovision matching process. A better performance of the proposed method is illustrated by comparative analysis against some recent global matching methods

    Stereo Vision Matching using Characteristics Vectors

    Get PDF
    Stereo vision is a usual method to obtain depth information from images. The problems encountered when applying the majority of well established algorithms to provide this information are due to the high computational load required. This occurs in both the block matching and graphical cues (such as edges) matching. In this article we address this issue by performing an image analysis which considers each pixel only once, thus enhancing the efficiency of the image processing. Additionally, when matching is carried out over statistical descriptors of the image regions, commonly referred to as characteristic vectors, whose number of these vectors is, by definition, lower than the possible block matching possibilities, the algorithm achieves an improved level of performance. In this paper we present a new algorithm which has been specifically designed to solve the commonly observed problems which arise from other well know techniques. This algorithm was designed using a previous work carried out by the authors in this area to determine the descriptors extraction processes. The complete analysis has been carried out over gray scale images. The results obtained from both real and synthetic images are presented in terms of matching quality and time consumption and compared to other published results. Finally, a discussion is provided on additional features related to the matching process

    Fuzzy cognitive maps for stereovision matching

    Get PDF
    This paper outlines a method for solving the stereovision matching problem using edge segments as the primitives. In stereovision matching the following constraints are commonly used: epipolar, similarity, smoothness, ordering and uniqueness. We propose a new matching strategy under a fuzzy context in which such constraints are mapped. The fuzzy context integrates both Fuzzy Clustering and Fuzzy Cognitive Maps. With such purpose a network of concepts (nodes) is designed, each concept represents a pair of primitives to be matched. Each concept has associated a fuzzy value which determines the degree of the correspondence. The goal is to achieve high performance in terms of correct matches. The main findings of this paper are reflected in the use of the fuzzy context that allows building the network of concepts where the matching constraints are mapped. Initially, each concept value is loaded via the Fuzzy Clustering and then updated by the Fuzzy Cognitive Maps framework. This updating is achieved through the influence of the remainder neighboring concepts until a good global matching solution is achieved. Under this fuzzy approach we gain quantitative and qualitative matching correspondences. This method works as a relaxation matching approach and its performance is illustrated by comparative analysis against some existing global matching methods. (c) 2006 Pattern Recognition Society. Published by Elsevier Ltd. All rights reserved

    T茅cnicas de visi贸n estereosc贸pica para determinar la estructura tridimensional de la escena

    Get PDF
    En este trabajo se realiza un estudio sobre la efectividad de una serie de m茅todos de correspondencia estereosc贸pica. La correspondencia estereosc贸pica constituye uno de los pasos esenciales dentro de la visi贸n estereosc贸pica en los sistemas robotizados, de ah铆 su importancia. El objetivo se centra en el estudio de la viabilidad de los mismos de cara a su implementaci贸n en sistemas estereosc贸picos que han de operar en entornos de exterior y bajo condiciones del entorno adversas. La motivaci贸n del trabajo proviene de la necesidad derivada de una serie de proyectos de investigaci贸n dentro de las actividades del grupo ISCAR. En este trabajo se han realizado diversas pruebas experimentales orientadas a la identificaci贸n de los m茅todos m谩s prometedores en el 谩mbito de la correspondencia estereosc贸pica con la finalidad indicada. Se han estudiado varias t茅cnicas existentes en la literatura y se han establecido las pautas a seguir en el futuro a tenor de los resultados obtenidos para su implementaci贸n en sistemas reales. [ABSTRACT] In this work we have studied several stereovision matching approaches with the aim of testing its effectiveness. The main step in robotized systems, equipped with stereovision, is the correspondence, here is its relevance. The goal of this work is focused on the study of the viability of such methods with the aim that they can be implemented in stereoscopic vision-based systems working in adverse outdoor environmental conditions. This work is motivated because the ISCAR group is currently working in several research projects where the stereovision is a crucial system. In this work several experimental tests have been carried out oriented toward the identification of the most promising correspondence methods with the above expressed goal. Several existing approaches in the literature have been studied and, as a result, some guidelines have been established based on the results reported, so that the research is oriented toward future implementations in real systems

    Percepci贸n basada en visi贸n estereosc贸pica, planificaci贸n de trayectorias y estrategias de navegaci贸n para exploraci贸n rob贸tica aut贸noma

    Get PDF
    Tesis in茅dita de la Universidad Complutense de Madrid, Facultad de Inform谩tica, Departamento de Ingenier铆a del Software e Inteligencia artificial, le铆da el 13-05-2015En esta tesis se trata el desarrollo de una estrategia de navegaci贸n aut贸noma basada en visi贸n artificial para exploraci贸n rob贸tica aut贸noma de superficies planetarias. Se han desarrollado una serie de subsistemas, m贸dulos y software espec铆ficos para la investigaci贸n desarrollada en este trabajo, ya que la mayor铆a de las herramientas existentes para este dominio son propiedad de agencias espaciales nacionales, no accesibles a la comunidad cient铆fica. Se ha dise帽ado una arquitectura software modular multi-capa con varios niveles jer谩rquicos para albergar el conjunto de algoritmos que implementan la estrategia de navegaci贸n aut贸noma y garantizar la portabilidad del software, su reutilizaci贸n e independencia del hardware. Se incluye tambi茅n el dise帽o de un entorno de trabajo destinado a dar soporte al desarrollo de las estrategias de navegaci贸n. 脡ste se basa parcialmente en herramientas de c贸digo abierto al alcance de cualquier investigador o instituci贸n, con las necesarias adaptaciones y extensiones, e incluye capacidades de simulaci贸n 3D, modelos de veh铆culos rob贸ticos, sensores, y entornos operacionales, emulando superficies planetarias como Marte, para el an谩lisis y validaci贸n a nivel funcional de las estrategias de navegaci贸n desarrolladas. Este entorno tambi茅n ofrece capacidades de depuraci贸n y monitorizaci贸n.La presente tesis se compone de dos partes principales. En la primera se aborda el dise帽o y desarrollo de las capacidades de autonom铆a de alto nivel de un rover, centr谩ndose en la navegaci贸n aut贸noma, con el soporte de las capacidades de simulaci贸n y monitorizaci贸n del entorno de trabajo previo. Se han llevado a cabo un conjunto de experimentos de campo, con un robot y hardware real, detall谩ndose resultados, tiempo de procesamiento de algoritmos, as铆 como el comportamiento y rendimiento del sistema en general. Como resultado, se ha identificado al sistema de percepci贸n como un componente crucial dentro de la estrategia de navegaci贸n y, por tanto, el foco principal de potenciales optimizaciones y mejoras del sistema. Como consecuencia, en la segunda parte de este trabajo, se afronta el problema de la correspondencia en im谩genes est茅reo y reconstrucci贸n 3D de entornos naturales no estructurados. Se han analizado una serie de algoritmos de correspondencia, procesos de imagen y filtros. Generalmente se asume que las intensidades de puntos correspondientes en im谩genes del mismo par est茅reo es la misma. Sin embargo, se ha comprobado que esta suposici贸n es a menudo falsa, a pesar de que ambas se adquieren con un sistema de visi贸n compuesto de dos c谩maras id茅nticas. En consecuencia, se propone un sistema experto para la correcci贸n autom谩tica de intensidades en pares de im谩genes est茅reo y reconstrucci贸n 3D del entorno basado en procesos de imagen no aplicados hasta ahora en el campo de la visi贸n est茅reo. 脡stos son el filtrado homom贸rfico y la correspondencia de histogramas, que han sido dise帽ados para corregir intensidades coordinadamente, ajustando una imagen en funci贸n de la otra. Los resultados se han podido optimizar adicionalmente gracias al dise帽o de un proceso de agrupaci贸n basado en el principio de continuidad espacial para eliminar falsos positivos y correspondencias err贸neas. Se han estudiado los efectos de la aplicaci贸n de dichos filtros, en etapas previas y posteriores al proceso de correspondencia, con eficiencia verificada favorablemente. Su aplicaci贸n ha permitido la obtenci贸n de un mayor n煤mero de correspondencias v谩lidas en comparaci贸n con los resultados obtenidos sin la aplicaci贸n de los mismos, consiguiendo mejoras significativas en los mapas de disparidad y, por lo tanto, en los procesos globales de percepci贸n y reconstrucci贸n 3D.Depto. de Ingenier铆a de Software e Inteligencia Artificial (ISIA)Fac. de Inform谩ticaTRUEunpu

    Ayuda t茅cnica para la autonom铆a en el desplazamiento

    Get PDF
    The project developed in this thesis involves the design, implementation and evaluation of a new technical assistance aiming to ease the mobility of people with visual impairments. By using processing and sounds synthesis, the users can hear the sonification protocol (through bone conduction) informing them, after training, about the position and distance of the various obstacles that may be on their way, avoiding eventual accidents. In this project, surveys were conducted with experts in the field of rehabilitation, blindness and techniques of image processing and sound, which defined the user requirements that served as guideline for the design. The thesis consists of three self-contained blocks: (i) image processing, where 4 processing algorithms are proposed for stereo vision, (ii) sonification, which details the proposed sound transformation of visual information, and (iii) a final central chapter on integrating the above and sequentially evaluated in two versions or implementation modes (software and hardware). Both versions have been tested with both sighted and blind participants, obtaining qualitative and quantitative results, which define future improvements to the project. ---------------------------------------------------------------------------------------------------------------------------------------------El proyecto desarrollado en la presente tesis doctoral consiste en el dise帽o, implementaci贸n y evaluaci贸n de una nueva ayuda t茅cnica orientada a facilitar la movilidad de personas con discapacidad visual. El sistema propuesto consiste en un procesador de estereovisi贸n y un sintetizador de sonidos, mediante los cuales, las usuarias y los usuarios pueden escuchar un c贸digo de sonidos mediante transmisi贸n 贸sea que les informa, previo entrenamiento, de la posici贸n y distancia de los distintos obst谩culos que pueda haber en su camino, evitando accidentes. En dicho proyecto, se han realizado encuestas a expertos en el campo de la rehabilitaci贸n, la ceguera y en las t茅cnicas y tecnolog铆as de procesado de imagen y sonido, mediante las cuales se definieron unos requisitos de usuario que sirvieron como gu铆a de propuesta y dise帽o. La tesis est谩 compuesta de tres grandes bloques autocontenidos: (i) procesado de imagen, donde se proponen 4 algoritmos de procesado de visi贸n est茅reo, (ii) sonificaci贸n, en el cual se detalla la propuesta de transformaci贸n a sonido de la informaci贸n visual, y (iii) un 煤ltimo cap铆tulo central sobre integraci贸n de todo lo anterior en dos versiones evaluadas secuencialmente, una software y otra hardware. Ambas versiones han sido evaluadas con usuarios tanto videntes como invidentes, obteniendo resultados cualitativos y cuantitativos que permiten definir mejoras futuras sobre el proyecto finalmente implementado
    corecore