2,614 research outputs found
Implicit 3D Orientation Learning for 6D Object Detection from RGB Images
We propose a real-time RGB-based pipeline for object detection and 6D pose
estimation. Our novel 3D orientation estimation is based on a variant of the
Denoising Autoencoder that is trained on simulated views of a 3D model using
Domain Randomization. This so-called Augmented Autoencoder has several
advantages over existing methods: It does not require real, pose-annotated
training data, generalizes to various test sensors and inherently handles
object and view symmetries. Instead of learning an explicit mapping from input
images to object poses, it provides an implicit representation of object
orientations defined by samples in a latent space. Our pipeline achieves
state-of-the-art performance on the T-LESS dataset both in the RGB and RGB-D
domain. We also evaluate on the LineMOD dataset where we can compete with other
synthetically trained approaches. We further increase performance by correcting
3D orientation estimates to account for perspective errors when the object
deviates from the image center and show extended results.Comment: Code available at: https://github.com/DLR-RM/AugmentedAutoencode
Evaluating perceptual maps of asymmetries for gait symmetry quantification and pathology detection
Le mouvement de la marche est un processus essentiel de l'activité
humaine et aussi le résultat de nombreuses interactions collaboratives
entre les systĂšmes neurologiques, articulaires et
musculo-squelettiques fonctionnant ensemble efficacement. Ceci
explique pourquoi une analyse de la marche est aujourd'hui de plus en
plus utilisée pour le diagnostic (et aussi la prévention) de
différents types de maladies (neurologiques, musculaires,
orthopédique, etc.). Ce rapport présente une nouvelle méthode pour
visualiser rapidement les diffĂ©rentes parties du corps humain liĂ©es Ă
une possible asymétrie (temporellement invariante par translation)
existant dans la démarche d'un patient pour une possible utilisation
clinique quotidienne. L'objectif est de fournir une méthode à la fois
facile et peu dispendieuse permettant la mesure et l'affichage visuel,
d'une maniÚre intuitive et perceptive, des différentes parties
asymétriques d'une démarche. La méthode proposée repose sur
l'utilisation d'un capteur de profondeur peu dispendieux (la Kinect)
qui est trÚs bien adaptée pour un diagnostique rapide effectué dans de
petites salles mĂ©dicales car ce capteur est d'une part facile Ă
installer et ne nécessitant aucun marqueur. L'algorithme que nous
allons présenter est basé sur le fait que la marche saine possÚde des
propriétés de symétrie (relativement à une invariance temporelle) dans
le plan coronal.The gait movement is an essential process of the human activity and
also the result of coordinated effort between the neurological,
articular and musculoskeletal systems. This motivates why gait
analysis is important and also increasingly used nowadays for the
(possible early) diagnosis of many different types (neurological,
muscular, orthopedic, etc.) of diseases. This paper introduces a
novel method to quickly visualize the different parts of the body
related to an asymmetric movement in the human gait of a patient for
daily clinical. The goal is to provide a cheap and easy-to-use method
to measure the gait asymmetry and display results in a perceptually
relevant manner. This method relies on an affordable consumer depth
sensor, the Kinect. The Kinect was chosen because this device is
amenable for use in small, confined area, like a living room. Also,
since it is marker-less, it provides a fast non-invasive diagnostic.
The algorithm we are going to introduce relies on the fact that a
healthy walk has (temporally shift-invariant) symmetry properties in
the coronal plane
Rekonstruktion und skalierbare Detektion und Verfolgung von 3D Objekten
The task of detecting objects in images is essential for autonomous systems to categorize, comprehend and eventually navigate or manipulate its environment. Since many applications demand not only detection of objects but also the estimation of their exact poses, 3D CAD models can prove helpful since they provide means for feature extraction and hypothesis refinement. This work, therefore, explores two paths: firstly, we will look into methods to create richly-textured and geometrically accurate models of real-life objects. Using these reconstructions as a basis, we will investigate on how to improve in the domain of 3D object detection and pose estimation, focusing especially on scalability, i.e. the problem of dealing with multiple objects simultaneously.Objekterkennung in Bildern ist fĂŒr ein autonomes System von entscheidender Bedeutung, um seine Umgebung zu kategorisieren, zu erfassen und schlieĂlich zu navigieren oder zu manipulieren. Da viele Anwendungen nicht nur die Erkennung von Objekten, sondern auch die SchĂ€tzung ihrer exakten Positionen erfordern, können sich 3D-CAD-Modelle als hilfreich erweisen, da sie Mittel zur Merkmalsextraktion und Verfeinerung von Hypothesen bereitstellen. In dieser Arbeit werden daher zwei Wege untersucht: Erstens werden wir Methoden untersuchen, um strukturreiche und geometrisch genaue Modelle realer Objekte zu erstellen. Auf der Grundlage dieser Konstruktionen werden wir untersuchen, wie sich der Bereich der 3D-Objekterkennung und der PosenschĂ€tzung verbessern lĂ€sst, wobei insbesondere die Skalierbarkeit im Vordergrund steht, d.h. das Problem der gleichzeitigen Bearbeitung mehrerer Objekte
- âŠ