thesis

Aprendizaje profundo y geometría para estimación densa de profundidad en pares de imágenes de ojo de pez.

Abstract

Este trabajo fin de grado se centra en la estimación de un mapa de profundidad denso a partir de un par de imágenes estéreo con distorsión de ‘Ojo de Pez’. La estimación de un punto a partir de su proyección en un par de imágenes estéreo es un problema geométricamente sencillo, al conocer la geometría de la cámara utilizada. En cambio, obtener un resultado denso de la imagen al completo es un problema difícil de resolver. Ya que se debe buscar a lo largo de línea epipolar para cada píxel que en este caso es curva debido a la distorsión de la imagen, la solución no es trivial debido a que el rango de búsqueda es infinito. En este trabajo se busca acotar este rango de búsqueda para así simplificar el problema. Para ello se hace uso de una red neuronal o inteligencia artificial (AI), en específico, la red MiDaS la cual estima un mapa denso de profundidad de imágenes monoculares, en el que cada píxel contiene una ‘Semilla de profundidad’, es decir, un valor de distancia por cada píxel. Este mapa denso aporta regiones de incertidumbre para cada píxel, lo que permite acotar considerablemente la búsqueda en la curva epipolar. Sin embargo, hay varias consideraciones a tener en cuenta para poder utilizar este mapa como semilla. En primer lugar, al ser una estimación monocular, el mapa denso proporcionado por la red no tiene la escala correcta. Esta escala se corrige a partir de las medidas de profundidad de emparejamientos aislados que son más fáciles de estimar. En segundo lugar, el sistema estéreo que define la cámara utilizada consta de dos lentes con gran distorsión de ‘Ojo de pez’, y MiDaS funciona correctamente en imágenes en perspectiva. Por lo tanto, en este trabajo se han definido y aplicado los modelos proyectivos que permiten rectificar y des rectificar la distorsión, y se han incluido algoritmos para obtener una reconstrucción idónea y suavizada de las imágenes.<br /

    Similar works