5 research outputs found

    Robot Vision in Industrial Assembly and Quality Control Processes

    Get PDF

    Boosting for Generic 2D/3D Object Recognition

    Get PDF
    Generic object recognition is an important function of the human visual system. For an artificial vision system to be able to emulate the human perception abilities, it should also be able to perform generic object recognition. In this thesis, we address the generic object recognition problem and present different approaches and models which tackle different aspects of this difficult problem. First, we present a model for generic 2D object recognition from complex 2D images. The model exploits only appearance-based information, in the form of a combination of texture and color cues, for binary classification of 2D object classes. Learning is accomplished in a weakly supervised manner using Boosting. However, we live in a 3D world and the ability to recognize 3D objects is very important for any vision system. Therefore, we present a model for generic recognition of 3D objects from range images. Our model makes use of a combination of simple local shape descriptors extracted from range images for recognizing 3D object categories, as shape is an important information provided by range images. Moreover, we present a novel dataset for generic object recognition that provides 2D and range images about different object classes using a Time-of-Flight (ToF) camera. As the surrounding world contains thousands of different object categories, recognizing many different object classes is important as well. Therefore, we extend our generic 3D object recognition model to deal with the multi-class learning and recognition task. Moreover, we extend the multi-class recognition model by introducing a novel model which uses a combination of appearance-based information extracted from 2D images and range-based (shape) information extracted from range images for multi-class generic 3D object recognition and promising results are obtained

    Automatische Registrierung adaptiver Modelle zur Typerkennung technischer Objekte [online]

    Get PDF
    Anwendungen der Bildanalyse werden in zunehmendem Maße unter Verwendung dreidimensionaler Modelle realisiert und fusionieren auf diese Weise Methoden der Computergrafik und der Bildauswertung. Mit dem Ziel der automatischen Erfassung dynamischer Szenenaktivitäten ist in den letzten Jahren ein vermehrter Einsatz adaptiver Modelle zu beobachten. In der vorliegenden Arbeit wird ein neu entwickeltes Verfahren zur automatischen Konstruktion adaptiver Modelle für technische Objekte vorgestellt. Ferner werden Module zur automatischen Anpassung dieser adaptiven Modelle an Grauwertbilder beschrieben, die durch Synthese-Analyse-Iterationen die Brücke zur Bildanalyse schlagen. Die zentrale Stärke der vorgestellten Komponenten liegt darin, dass sie aus Einzelbildern dreidimensionale Rekonstruktionen für unbekannte Objektvarianten liefern. Wie experimentell gezeigt wird, sind diese Rekonstruktionen geometrisch genauer als handelsübliche Modelle. Die Leistungsfähigkeit der entwickelten Verfahren wird am Beispiel der Flugzeugtypisierung gezeigt. Darüber hinaus wird die Anwendbarkeit der Module zur Lageschätzung demonstriert

    Semi-supervised learning for image classification

    Get PDF
    Object class recognition is an active topic in computer vision still presenting many challenges. In most approaches, this task is addressed by supervised learning algorithms that need a large quantity of labels to perform well. This leads either to small datasets (< 10,000 images) that capture only a subset of the real-world class distribution (but with a controlled and verified labeling procedure), or to large datasets that are more representative but also add more label noise. Therefore, semi-supervised learning is a promising direction. It requires only few labels while simultaneously making use of the vast amount of images available today. We address object class recognition with semi-supervised learning. These algorithms depend on the underlying structure given by the data, the image description, and the similarity measure, and the quality of the labels. This insight leads to the main research questions of this thesis: Is the structure given by labeled and unlabeled data more important than the algorithm itself? Can we improve this neighborhood structure by a better similarity metric or with more representative unlabeled data? Is there a connection between the quality of labels and the overall performance and how can we get more representative labels? We answer all these questions, i.e., we provide an extensive evaluation, we propose several graph improvements, and we introduce a novel active learning framework to get more representative labels.Objektklassifizierung ist ein aktives Forschungsgebiet in maschineller Bildverarbeitung was bisher nur unzureichend gelöst ist. Die meisten Ansätze versuchen die Aufgabe durch überwachtes Lernen zu lösen. Aber diese Algorithmen benötigen eine hohe Anzahl von Trainingsdaten um gut zu funktionieren. Das führt häufig entweder zu sehr kleinen Datensätzen (< 10,000 Bilder) die nicht die reale Datenverteilung einer Klasse wiedergeben oder zu sehr grossen Datensätzen bei denen man die Korrektheit der Labels nicht mehr garantieren kann. Halbüberwachtes Lernen ist eine gute Alternative zu diesen Methoden, da sie nur sehr wenige Labels benötigen und man gleichzeitig Datenressourcen wie das Internet verwenden kann. In dieser Arbeit adressieren wir Objektklassifizierung mit halbüberwachten Lernverfahren. Diese Algorithmen sind sowohl von der zugrundeliegenden Struktur, die sich aus den Daten, der Bildbeschreibung und der Distanzmasse ergibt, als auch von der Qualität der Labels abhängig. Diese Erkenntnis hat folgende Forschungsfragen aufgeworfen: Ist die Struktur wichtiger als der Algorithmus selbst? Können wir diese Struktur gezielt verbessern z.B. durch eine bessere Metrik oder durch mehr Daten? Gibt es einen Zusammenhang zwischen der Qualität der Labels und der Gesamtperformanz der Algorithmen? In dieser Arbeit beantworten wir diese Fragen indem wir diese Methoden evaluieren. Ausserdem entwickeln wir neue Methoden um die Graphstruktur und die Labels zu verbessern

    Learning Appearance Models for Object Recognition

    No full text
    . We describe how to model the appearance of an object using multiple views, learn such a model from training images, and recognize objects with it. The model uses probability distributions to characterize the significance, position, and intrinsic measurements of various discrete features of appearance; it also describes topological relations among features. The features and their distributions are learned from training images depicting the modeled object. A matching procedure, combining qualities of both alignment and graph subisomorphism methods, uses feature uncertainty information recorded by the model to guide the search for a match between model and image. Experiments show the method capable of learning to recognize complex objects in cluttered images, acquiring models that represent those objects using relatively few views. 1 Introduction The multiple-view object recognition approach models an object with a series of views, each describing the object&apos;s appearance over a small r..
    corecore