El objetivo de este proyecto es utilizar pasos de peatones, de los denominados
pasos de cebra, como puntos de referencia dentro del entorno, de
tal forma que estos sirvan para corregir el error de posicionamiento que cometen
sistemas como la Odometría Visual o el GPS, a la hora de localizar
un vehículo en el plano. El trabajo desarrollado en este proyecto se podría
dividir en dos partes.
La primera de ellas, es el desarrollo de un algoritmo de visión por computador
que permite reconocer los pasos de peatones mediante un sistema de
cámaras estereoscópicas instalado en un coche. Para lograr este objetivo, en
primer lugar, las imágenes obtenidas por una de las cámaras son procesadas
con la combinación de un ltro de percentil 43 aplicado a nivel local más una
umbralización (Sebsadji et al., 2010). Este proceso se realiza con el n de
extraer aquellos píxeles de la imagen original que pertenecen potencialmente
a marcas pintadas en la carretera. Si un píxel de la captura inicial tiene un
nivel de gris mayor que el de su correspondiente de la imagen ltrada más el
umbral seleccionado, ese píxel es considerado perteneciente a una marca vial,
lo que en de nitiva, quiere decir que éste tiene un nivel de gris mucho más
alto que el de aquellos píxeles próximos a él. El resultado de este proceso,
por tanto, es una imagen binaria que representa en blanco todos aquellos
píxeles que pueden pertenecer a una marca vial.
Aparte de las marcas viales, fuera de la calzada hay muchos píxeles que
cumplen esta condición. Para eliminar de la imagen binaria obtenida todos
aquellos que no están sobre la carretera, se utiliza un algoritmo, perteneciente
a otro proyecto de la universidad, que realiza este proceso utilizando el
mapa de disparidad y el u-disparity de la escena. Es posible obtener estas
estructuras gracias al sistema estereoscópico de cámaras.
Tras estos dos procesos se obtiene una imagen binaria que representa únicamente
las marcas viales. Si además la parte inferior de la imagen es muy
oscura, previamente a estas operaciones se le realiza una mejora de contraste,
que realza la zona de la misma correspondiente a la calzada. También serealiza una erosión para eliminar errores de segmentación.
Una vez extraídas las marcas viales de la imagen original, se distinguen
las que son pasos de peatones del resto mediante un análisis de las frecuencias
de la transformada rápida de Fourier (Fast Fourier Transform, FFT).
Para obtener ésta se usa la proyección horizontal, la cual se obtiene como
resultado de la suma de los píxeles de cada columna de la imagen binaria
obtenida. Cuando se detecte un paso de peatones, se calculará su posición
en la imagen y su distancia con respecto al vehículo. Para determinar la
posición, se utiliza la losofía anterior de la proyección horizontal, aplicada
en esta ocasión a las las de la imagen binaria (proyección vertical). Una
vez calculada ésta, se hace uso del per l de la calzada y los parámetros
ópticos del sistema para calcular su distancia. Para aproximar el per l de
la calzada se utilizará el v-disparity y la Transformada de Hough para rectas.
En la segunda parte del trabajo, una vez detectado un paso de peatones
y conocida su posición relativa respecto al vehículo, se pretende usar esta
información para corregir el error de posicionamiento que introducen otros
sistemas de localización. Usando como dato la cartografía de OpenStreetMap
(OSM), si un sistema de localización como el GPS, o la Odometría Visual,
predice que el coche se aproxima a un paso de peatones, el algoritmo de
visión entraría en funcionamiento. Si el paso de peatones fuera detectado
por el algoritmo de visión antes o después de lo previsto por el sistema de
posicionamiento tradicional, el error que éste cómete podría ser estimado
y corregido, reposicionando el vehículo en su localización correcta dentro
del mapa. Esta parte sólo es desarrollada de manera teórica en el presente
proyecto, de tal manera que se propone su implementación para futuros
trabajos.The objective of this project is to use zebra crossings as reference points
within the environment, in order to correct the positioning error of systems
like visual odometry or GPS, when locatinh a vehicle in a map. The work
developed in this project can be divided into two parts.
The rst one, consists in the development of a computer vision algorithm
that can recognize zebra crossings using a stereoscopic camera system installed
in a car. To achieve this goal, images obtained by the cameras are
processed by a mix of a local 43rd percentile lter plus a thresholding (Sebsadji
et al., 2010). The nal purpose of this is to extract from an image
taken by one of the cameras those pixels which potentially belong to markings
painted on the road. If the pixel in the original image had a gray level
higher than its corresponding in the ltered image plus the threshold, that
pixel would be considered to belong-to a road marking and therefore that
pixel contains a gray level much higher than the pixels next to it. The result
of this process is a binary image which represents in white colour those pixels
that belong to a road marking.
In addition to the road markings, outside the road there are many pixels
that meet this condition. An algorithm belonging to another college project
is used to remove all those pixels that are not on the road from the binary
image. This algorithm performs this process using the disparity map and the
u disparity. This is possible thanks of the stereoscopic camera system.
After these two processes take place, a binary image which represents
only road markings is obtained. A contrast enhancement of this part of the
image is done if the bottom part of the picture is too dark. An erode operation
is also performed to remove segmentation errors.
When road markings in the image have been extracted from it, zebra
crossings are distinguished of the rest of road markings using a frequency
analysis of the Fast Fourier Transform (FFT); this transform is obtained
from the histogram that results of the adding of the pixels of each of the colums from the ltered image (horizontal projection). When the zebra crossing
is detected its position is computed using the vertical projection and its
distance is obtained by using the v disparity and the Hough Transform.
In the second part of this paper, once a zebra crossing has been detected
and its position relative to the vehicle is known, this information will be used
to correct the positioning error that another location systems, like GPS or
Visual Odometry, have. Using the OpenStreetMap mapping as an input, if a
system like GPS predicted the car is close to a zebra crossing, the algorithm
would be activated. If the zebra crossing was detected by our algorithm before
or later than the traditional positioning system expects, the error could be
inferred and corrected, repositioning the vehicle in its correct location on the
map. This part is only theoretically developed, however its implementation
is intended in future researches.Ingeniería Industria