CrossDetect : detección de pasos de peatones usando algoritmos de visión por computador para la mejora del posicionamiento de vehículos

Marín Cabeza, Adrián T.

thesis

CrossDetect : detección de pasos de peatones usando algoritmos de visión por computador para la mejora del posicionamiento de vehículos

Authors: Adrián T. Marín Cabeza
Publication date: 1 January 2014
Publisher

Abstract

El objetivo de este proyecto es utilizar pasos de peatones, de los denominados pasos de cebra, como puntos de referencia dentro del entorno, de tal forma que estos sirvan para corregir el error de posicionamiento que cometen sistemas como la Odometría Visual o el GPS, a la hora de localizar un vehículo en el plano. El trabajo desarrollado en este proyecto se podría dividir en dos partes. La primera de ellas, es el desarrollo de un algoritmo de visión por computador que permite reconocer los pasos de peatones mediante un sistema de cámaras estereoscópicas instalado en un coche. Para lograr este objetivo, en primer lugar, las imágenes obtenidas por una de las cámaras son procesadas con la combinación de un ltro de percentil 43 aplicado a nivel local más una umbralización (Sebsadji et al., 2010). Este proceso se realiza con el n de extraer aquellos píxeles de la imagen original que pertenecen potencialmente a marcas pintadas en la carretera. Si un píxel de la captura inicial tiene un nivel de gris mayor que el de su correspondiente de la imagen ltrada más el umbral seleccionado, ese píxel es considerado perteneciente a una marca vial, lo que en de nitiva, quiere decir que éste tiene un nivel de gris mucho más alto que el de aquellos píxeles próximos a él. El resultado de este proceso, por tanto, es una imagen binaria que representa en blanco todos aquellos píxeles que pueden pertenecer a una marca vial. Aparte de las marcas viales, fuera de la calzada hay muchos píxeles que cumplen esta condición. Para eliminar de la imagen binaria obtenida todos aquellos que no están sobre la carretera, se utiliza un algoritmo, perteneciente a otro proyecto de la universidad, que realiza este proceso utilizando el mapa de disparidad y el u-disparity de la escena. Es posible obtener estas estructuras gracias al sistema estereoscópico de cámaras. Tras estos dos procesos se obtiene una imagen binaria que representa únicamente las marcas viales. Si además la parte inferior de la imagen es muy oscura, previamente a estas operaciones se le realiza una mejora de contraste, que realza la zona de la misma correspondiente a la calzada. También serealiza una erosión para eliminar errores de segmentación. Una vez extraídas las marcas viales de la imagen original, se distinguen las que son pasos de peatones del resto mediante un análisis de las frecuencias de la transformada rápida de Fourier (Fast Fourier Transform, FFT). Para obtener ésta se usa la proyección horizontal, la cual se obtiene como resultado de la suma de los píxeles de cada columna de la imagen binaria obtenida. Cuando se detecte un paso de peatones, se calculará su posición en la imagen y su distancia con respecto al vehículo. Para determinar la posición, se utiliza la losofía anterior de la proyección horizontal, aplicada en esta ocasión a las las de la imagen binaria (proyección vertical). Una vez calculada ésta, se hace uso del per l de la calzada y los parámetros ópticos del sistema para calcular su distancia. Para aproximar el per l de la calzada se utilizará el v-disparity y la Transformada de Hough para rectas. En la segunda parte del trabajo, una vez detectado un paso de peatones y conocida su posición relativa respecto al vehículo, se pretende usar esta información para corregir el error de posicionamiento que introducen otros sistemas de localización. Usando como dato la cartografía de OpenStreetMap (OSM), si un sistema de localización como el GPS, o la Odometría Visual, predice que el coche se aproxima a un paso de peatones, el algoritmo de visión entraría en funcionamiento. Si el paso de peatones fuera detectado por el algoritmo de visión antes o después de lo previsto por el sistema de posicionamiento tradicional, el error que éste cómete podría ser estimado y corregido, reposicionando el vehículo en su localización correcta dentro del mapa. Esta parte sólo es desarrollada de manera teórica en el presente proyecto, de tal manera que se propone su implementación para futuros trabajos.The objective of this project is to use zebra crossings as reference points within the environment, in order to correct the positioning error of systems like visual odometry or GPS, when locatinh a vehicle in a map. The work developed in this project can be divided into two parts. The rst one, consists in the development of a computer vision algorithm that can recognize zebra crossings using a stereoscopic camera system installed in a car. To achieve this goal, images obtained by the cameras are processed by a mix of a local 43rd percentile lter plus a thresholding (Sebsadji et al., 2010). The nal purpose of this is to extract from an image taken by one of the cameras those pixels which potentially belong to markings painted on the road. If the pixel in the original image had a gray level higher than its corresponding in the ltered image plus the threshold, that pixel would be considered to belong-to a road marking and therefore that pixel contains a gray level much higher than the pixels next to it. The result of this process is a binary image which represents in white colour those pixels that belong to a road marking. In addition to the road markings, outside the road there are many pixels that meet this condition. An algorithm belonging to another college project is used to remove all those pixels that are not on the road from the binary image. This algorithm performs this process using the disparity map and the u disparity. This is possible thanks of the stereoscopic camera system. After these two processes take place, a binary image which represents only road markings is obtained. A contrast enhancement of this part of the image is done if the bottom part of the picture is too dark. An erode operation is also performed to remove segmentation errors. When road markings in the image have been extracted from it, zebra crossings are distinguished of the rest of road markings using a frequency analysis of the Fast Fourier Transform (FFT); this transform is obtained from the histogram that results of the adding of the pixels of each of the colums from the ltered image (horizontal projection). When the zebra crossing is detected its position is computed using the vertical projection and its distance is obtained by using the v disparity and the Hough Transform. In the second part of this paper, once a zebra crossing has been detected and its position relative to the vehicle is known, this information will be used to correct the positioning error that another location systems, like GPS or Visual Odometry, have. Using the OpenStreetMap mapping as an input, if a system like GPS predicted the car is close to a zebra crossing, the algorithm would be activated. If the zebra crossing was detected by our algorithm before or later than the traditional positioning system expects, the error could be inferred and corrected, repositioning the vehicle in its correct location on the map. This part is only theoretically developed, however its implementation is intended in future researches.Ingeniería Industria