2,783 research outputs found
What's Wrong with the Absolute Trajectory Error?
One of the main limitations of the commonly used Absolute Trajectory Error
(ATE) is that it is highly sensitive to outliers. As a result, in the presence
of just a few outliers, it often fails to reflect the varying accuracy as the
inlier trajectory error or the number of outliers varies. In this work, we
propose an alternative error metric for evaluating the accuracy of the
reconstructed camera trajectory. Our metric, named Discernible Trajectory Error
(DTE), is computed in four steps: (1) Shift the ground-truth and estimated
trajectories such that both of their geometric medians are located at the
origin. (2) Rotate the estimated trajectory such that it minimizes the sum of
geodesic distances between the corresponding camera orientations. (3) Scale the
estimated trajectory such that the median distance of the cameras to their
geometric median is the same as that of the ground truth. (4) Compute the
distances between the corresponding cameras, and obtain the DTE by taking the
average of the mean and root-mean-square (RMS) distance. This metric is an
attractive alternative to the ATE, in that it is capable of discerning the
varying trajectory accuracy as the inlier trajectory error or the number of
outliers varies. Using the similar idea, we also propose a novel rotation error
metric, named Discernible Rotation Error (DRE), which has similar advantages to
the DTE. Furthermore, we propose a simple yet effective method for calibrating
the camera-to-marker rotation, which is needed for the computation of our
metrics. Our methods are verified through extensive simulations
Loosely-Coupled Semi-Direct Monocular SLAM
We propose a novel semi-direct approach for monocular simultaneous
localization and mapping (SLAM) that combines the complementary strengths of
direct and feature-based methods. The proposed pipeline loosely couples direct
odometry and feature-based SLAM to perform three levels of parallel
optimizations: (1) photometric bundle adjustment (BA) that jointly optimizes
the local structure and motion, (2) geometric BA that refines keyframe poses
and associated feature map points, and (3) pose graph optimization to achieve
global map consistency in the presence of loop closures. This is achieved in
real-time by limiting the feature-based operations to marginalized keyframes
from the direct odometry module. Exhaustive evaluation on two benchmark
datasets demonstrates that our system outperforms the state-of-the-art
monocular odometry and SLAM systems in terms of overall accuracy and
robustness.Comment: Accepted for publication in IEEE Robotics and Automation Letters.
Watch video demo at: https://youtu.be/j7WnU7ZpZ8
Robust Single Rotation Averaging Revisited
In this work, we propose a novel method for robust single rotation averaging
that can efficiently handle an extremely large fraction of outliers. Our
approach is to minimize the total truncated least unsquared deviations (TLUD)
cost of geodesic distances. The proposed algorithm consists of three steps:
First, we consider each input rotation as a potential initial solution and
choose the one that yields the least sum of truncated chordal deviations. Next,
we obtain the inlier set using the initial solution and compute its chordal
-mean. Finally, starting from this estimate, we iteratively compute the
geodesic -mean of the inliers using the Weiszfeld algorithm on . An
extensive evaluation shows that our method is robust against up to 99% outliers
given a sufficient number of accurate inliers, outperforming the current state
of the art
Why do we optimize what we optimize in multiple view geometry?
Para que un computador sea capaz de entender la geometrÃa 3D de su entorno, necesitamos derivar las relaciones geométricas entre las imágenes 2D y el mundo 3D.La geometrÃa de múltiples vistas es el área de investigación que estudia este problema.La mayor parte de métodos existentes resuelve pequeñas partes de este gran problema minimizando una determinada función objetivo.Estas funciones normalmente se componen de errores algebraicos o geométricos que representan las desviaciones con respecto al modelo de observación.En resumen, en general tratamos de recuperar la estructura 3D del mundo y el movimiento de la cámara encontrando el modelo que minimiza la discrepancia con respecto a las observaciones.El enfoque de esta tesis se centra principalmente en dos aspectos de los problemas de reconstrucción multivista:los criterios de error y la robustez.Primero, estudiamos los criterios de error usados en varios problemas geométricos y nos preguntamos`¿Por qué optimizamos lo que optimizamos?'EspecÃficamente, analizamos sus pros y sus contras y proponemos métodos novedosos que combinan los criterios existentes o adoptan una mejor alternativa.En segundo lugar, tratamos de alcanzar el estado del arte en robustez frente a valores atÃpicos y escenarios desafiantes, que a menudo se encuentran en la práctica.Para ello, proponemos múltiples ideas novedosas que pueden ser incorporadas en los métodos basados en optimización.EspecÃficamente, estudiamos los siguientes problemas: SLAM monocular, triangulación a partir de dos y de múltiples vistas, promedio de rotaciones únicas y múltiples, ajuste de haces únicamente con rotaciones de cámara, promedio robusto de números y evaluación cuantitativa de estimación de trayectoria.Para SLAM monocular, proponemos un enfoque hÃbrido novedoso que combina las fortalezas de los métodos directos y los basados en caracterÃsticas.Los métodos directos minimizan los errores fotométricos entre los pÃxeles correspondientes en varias imágenes, mientras que los métodos basados en caracterÃsticas minimizan los errores de reproyección.Nuestro método combina de manera débilmente acoplada la odometrÃa directa y el SLAM basado en caracterÃsticas, y demostramos que mejora la robustez en escenarios desafiantes, asà como la precisión cuando el movimiento de la cámara realiza frecuentes revisitas.Para la triangulación de dos vistas, proponemos métodos óptimos que minimizan los errores de reproyección angular en forma cerrada.Dado que el error angular es rotacionalmente invariante, estos métodos se pueden utilizar para cámaras perspectivas, lentes de ojo de pez u omnidireccionales.Además, son mucho más rápidos que los métodos óptimos existentes en la literatura.Otro método de triangulación de dos vistas que proponemos adopta un enfoque completamente diferente:Modificamos ligeramente el método clásico del punto medio y demostramos que proporciona un equilibrio superior de precisión 2D y 3D, aunque no es óptimo.Para la triangulación multivista, proponemos un método robusto y eficiente utilizando RANSAC de dos vistas.Presentamos varios criterios de finalización temprana para RANSAC de dos vistas utilizando el método de punto medio y mostramos que mejora la eficiencia cuando la proporción de medidas espúreas es alta.Además, mostramos que la incertidumbre de un punto triangulado se puede modelar en función de tres factores: el número de cámaras, el error medio de reproyección y el ángulo de paralaje máximo.Al aprender este modelo, la incertidumbre se puede interpolar para cada caso.Para promediar una sola rotación, proponemos un método robusto basado en el algoritmo de Weiszfeld.La idea principal es comenzar con una inicialización robusta y realizar un esquema de rechazo de valores espúreos implÃcito dentro del algoritmo de Weiszfeld para aumentar aún más la robustez.Además, usamos una aproximación de la mediana cordal en que proporciona una aceleración significativa del método. Para promediar rotaciones múltiples proponemos HARA, un enfoque novedoso que inicializa de manera incremental el grafo de rotaciones basado en una jerarquÃa de compatibilidad con tripletas.Esencialmente, construimos un árbol de expansión priorizando los enlaces con muchos soportes triples fuertes y agregando gradualmente aquellos con menos soportes y más débiles.Como resultado, reducimos el riesgo de agregar valores atÃpicos en la solución inicial, lo que nos permite filtrar los valores atÃpicos antes de la optimización no lineal.Además, mostramos que podemos mejorar los resultados usando la función suavizada L0+ en el paso de refinamiento local.A continuación, proponemos el ajuste de haces únicamente con rotaciones, un método novedoso para estimar las rotaciones absolutas de múltiples vistas independientemente de las traslaciones y la estructura de la escena.La clave es minimizar una función de coste especialmente diseñada basada en el error epipolar normalizado, que está estrechamente relacionado con el error de reproyección angular óptimo L1 entre otras cantidades geométricas.Nuestro enfoque brinda múltiples beneficios, como inmunidad total a translaciones y triangulaciones imprecisas, robustez frente a rotaciones puras y escenas planas, y la mejora de la precisión cuando se usa tras el promedio de promedio de rotaciones explicado anteriormente.También proponemos RODIAN, un método robusto para promediar un conjunto de números contaminados por una gran proporción de valores atÃpicos.En nuestro método, asumimos que los valores atÃpicos se distribuyen uniformemente dentro del rango de los datos y buscamos la región que es menos probable que contenga solo valores atÃpicos.Luego tomamos la mediana de los datos dentro de esta región.Nuestro método es rápido, robusto y determinista, y no se basa en un lÃmite de error interno conocido.Finalmente, para la evaluación cuantitativa de la trayectoria, señalamos la debilidad del Error de Trayectoria Absoluta (ATE) comúnmente utilizado y proponemos una alternativa novedosa llamada Error de Trayectoria Discernible (DTE).En presencia de solo unos pocos valores espúreos, el ATE pierde su sensibilidad respecto al error de trayectoria de los valores tÃpicos y respecto al número de datos atÃpicos o espúreos.El DTE supera esta debilidad al alinear la trayectoria estimada con la verdadera (ground truth) utilizando un método robusto basado en varios tipos diferentes de medianas.Usando ideas similares, también proponemos una métrica de solo rotación, llamada Error de Rotación Discernible (DRE).Además, proponemos un método simple para calibrar la rotación de cámara a marcador, que es un requisito previo para el cálculo de DTE y DRE.<br /
- …