66 research outputs found

    Multi-sensor based object detection in driving scenes

    No full text
    The work done in this internship consists in two main part. The first part is the design of an experimental platform to acquire data for testing and training. To design the experiments, onboard and onroad sensors have been considered. A calibration process has been conducted in order to integrated all the data from different sources. The second part was the use of a stereo system and a laser scanner to extract the free navigable space and to detect obstacles. This has been conducted through the use of an occupancy grid map representation

    Region of Interest Generation for Pedestrian Detection using Stereo Vision

    Get PDF
    Pedestrian detection is an active research area in the field of computer vision. The sliding window paradigm is usually followed to extract all possible detector windows, however, it is very time consuming. Subsequently, stereo vision using a pair of camera is preferred to reduce the search space that includes the depth information. Disparity map generation using feature correspondence is an integral part and a prior task to depth estimation. In our work, we apply the ORB features to fasten the feature correspondence process. Once the ROI generation phase is over, the extracted detector window is represented by low level histogram of oriented gradient (HOG) features. Subsequently, Linear Support Vector Machine (SVM) is applied to classify them as either pedestrian or non-pedestrian. The experimental results reveal that ORB driven depth estimation is at least seven times faster than the SURF descriptor and ten times faster than the SIFT descriptor

    Dense Stereo-Based ROI Generation for Pedestrian Detection

    Full text link

    Fast Object Hypotheses Generation Using 3D Position and 3D Motion

    Get PDF

    Calibration-free Pedestrian Partial Pose Estimation Using a High-mounted Kinect

    Get PDF
    Les applications de l’analyse du comportement humain ont subit de rapides dĂ©veloppements durant les derniĂšres dĂ©cades, tant au niveau des systĂšmes de divertissements que pour des applications professionnelles comme les interfaces humain-machine, les systĂšmes d’assistance de conduite automobile ou des systĂšmes de protection des piĂ©tons. Cette thĂšse traite du problĂšme de reconnaissance de piĂ©tons ainsi qu’à l’estimation de leur orientation en 3D. Cette estimation est faite dans l’optique que la connaissance de cette orientation est bĂ©nĂ©fique tant au niveau de l’analyse que de la prĂ©diction du comportement des piĂ©tons. De ce fait, cette thĂšse propose Ă  la fois une nouvelle mĂ©thode pour dĂ©tecter les piĂ©tons et une maniĂšre d’estimer leur orientation, par l’intĂ©gration sĂ©quentielle d’un module de dĂ©tection et un module d’estimation d’orientation. Pour effectuer cette dĂ©tection de piĂ©ton, nous avons conçu un classificateur en cascade qui gĂ©nĂšre automatiquement une boĂźte autour des piĂ©tons dĂ©tectĂ©s dans l’image. Suivant cela, des rĂ©gions sont extraites d’un nuage de points 3D afin de classifier l’orientation du torse du piĂ©ton. Cette classification se base sur une image synthĂ©tique grossiĂšre par tramage (rasterization) qui simule une camĂ©ra virtuelle placĂ©e immĂ©diatement au-dessus du piĂ©ton dĂ©tectĂ©. Une machine Ă  vecteurs de support effectue la classification Ă  partir de cette image de synthĂšse, pour l’une des 10 orientations discrĂštes utilisĂ©es lors de l’entrainement (incrĂ©ments de 30 degrĂ©s). Afin de valider les performances de notre approche d’estimation d’orientation, nous avons construit une base de donnĂ©es de rĂ©fĂ©rence contenant 764 nuages de points. Ces donnĂ©es furent capturĂ©es Ă  l’aide d’une camĂ©ra Kinect de Microsoft pour 30 volontaires diffĂ©rents, et la vĂ©ritĂ©-terrain sur l’orientation fut Ă©tablie par l’entremise d’un systĂšme de capture de mouvement Vicon. Finalement, nous avons dĂ©montrĂ© les amĂ©liorations apportĂ©es par notre approche. En particulier, nous pouvons dĂ©tecter des piĂ©tons avec une prĂ©cision de 95.29% et estimer l’orientation du corps (dans un intervalle de 30 degrĂ©s) avec une prĂ©cision de 88.88%. Nous espĂ©rons ainsi que nos rĂ©sultats de recherche puissent servir de point de dĂ©part Ă  d’autres recherches futures.The application of human behavior analysis has undergone rapid development during the last decades from entertainment system to professional one, as Human Robot Interaction (HRI), Advanced Driver Assistance System (ADAS), Pedestrian Protection System (PPS), etc. Meanwhile, this thesis addresses the problem of recognizing pedestrians and estimating their body orientation in 3D based on the fact that estimating a person’s orientation is beneficial in determining their behavior. In this thesis, a new method is proposed for detecting and estimating the orientation, in which the result of a pedestrian detection module and a orientation estimation module are integrated sequentially. For the goal of pedestrian detection, a cascade classifier is designed to draw a bounding box around the detected pedestrian. Following this, extracted regions are given to a discrete orientation classifier to estimate pedestrian body’s orientation. This classification is based on a coarse, rasterized depth image simulating a top-view virtual camera, and uses a support vector machine classifier that was trained to distinguish 10 orientations (30 degrees increments). In order to test the performance of our approach, a new benchmark database contains 764 sets of point cloud for body-orientation classification was captured. For this benchmark, a Kinect recorded the point cloud of 30 participants and a marker-based motion capture system (Vicon) provided the ground truth on their orientation. Finally we demonstrated the improvements brought by our system, as it detected pedestrian with an accuracy of 95:29% and estimated the body orientation with an accuracy of 88:88%.We hope it can provide a new foundation for future researches

    Stereo-based Pedestrian Detection and Path Prediction

    Get PDF
    In den letzten Jahren gab es eine rasante Entwicklung von Fahrerassistenzsystemen (Englisch: Advanced Driver Assistance Systems oder kurz ADAS). Diese Systeme unterstĂŒtzen nicht nur den Fahrer, sondern erhöhen durch das automatische Einleiten von Sicherheitreaktionen des Fahrzeuges selber auch die Sicherheit aller anderen Verkehrsteilnehmer. ZukĂŒnftige aktive FußgĂ€ngerschutzsystem in Intelligentem Fahrzeugen mĂŒssen nun noch einen Schritt weiter gehen und lernen, ein genaues Bild ihrer Umgebung und der darin wĂ€hrend der Fahrt zu erwartenden Änderungen zu entwickeln. Diese Arbeit widmet sich der Verbesserung bildgestĂŒtzter FußgĂ€ngerschutzsysteme. Es werden darin neue Methoden der Bildhypothesengenerierung (englisch: region of interest (ROI) generation), FußgĂ€ngerklassifikation, Pfadvorhersage und Absichstserkennung entwickelt. Die Leistung der FußgĂ€ngererkennung in realen, dynamischen Umgebungen mittels einer bewegten Kamera wird durch die Verwendung von dichtem Stereo in den unterschiedlichen Modulen verbessert. In einer Experimentalstudie wurde die Effizienz eines Systems zur monokularen FußgĂ€ngererkennung mit einem System verglichen, dass erweitert wurde um dichtes Stereo fĂŒr die Hypothesengenerierung und der FußgĂ€ngerverfolgung (englisch: tracking) zu nutzen. Das neue System erwies sich hierin als deutlich effizienter als das monokulare System. Diese Leistungssteigerung gab Anlass fĂŒr eine erweiterte Nutzung von dichtem Stereo bei der FußgĂ€ngererkennung. Die Hypothesengenerierung wurde durch die dynamische SchĂ€tzung der Kameraorientierung und des Straßenprofils weiter verbessert. Insbesondere bei hĂŒgeligen Straßen steigerte sich die Erkennungsleistung durch die Optimierung des Suchbereichs. ZusĂ€tzlich konnte die Klassifikationsleistung durch die Fusion von unterschiedlichen Merkmalen aus Bild und Tiefeninformation verbessert werden. Aufbauend auf den Erfolgen bei der FußgĂ€ngererkennung wird in der Arbeit ein System fĂŒr den Aktiven FußgĂ€ngerschutz vorgestellt, welches die Funktionen FußgĂ€ngererkennung, Situationsanalyse und Fahrzeugsteuerung kombiniert. FĂŒr die FußgĂ€ngerkennung wurden Ergebnisse eines Verfahrens zur bewegungsbasierten Objekterkennung mit Ergebnissen eines FußgĂ€ngerklassifikators fusioniert. Das System wurde in einen VersuchstrĂ€ger eingebaut und half dabei, UnfĂ€lle durch einen aktiven Lenkeingriff oder ein Notbremsemanöver zu vermeiden. Der letzte Teil der Arbeit befasst sich mit dem Problem der Pfadvorhersage und dem Erkennen der FußgĂ€ngerabsicht in Situationen, in denen sich der FußgĂ€nger nicht mit einer konstanten Geschwindigkeit bewegt. Zwei neue, lernbasierte AnsĂ€tze werden vorgestellt und mit aktuellen Verfahren verglichen. Durch die Verwendung von Merkmalen, die aus dichtem optischem Fluss generiert werden, ist es möglich den Pfad und die Absicht einer FußgĂ€ngers vorherzusagen. Das erste Verfahren lernt eine niedrigdimensionale Mannigfaltigkeit der Merkmale, die eine Vorhersage von Merkmale, Pfad und Absicht erlaubt. Das zweite Verfahren verwendet einen Suchbaum in dem Trajektorien abgelegt sind die mit Bewegungsmerkmalen erweitert wurden. Ein probabilistischer Suchalgorithmus ermöglicht die Vorhersage des FußgĂ€ngerpfads und Absicht. Die LeistungsfĂ€higkeit der Systeme wurde zusĂ€tzlich mit der Leistung von menschlichen Probanden verglichen. In dieser Arbeit wurde großer Wert auf die ausfĂŒhrliche Analyse der vorgestellten Verfahren und die Verwendung von realistischen TestdatensĂ€tzen gelegt. Die Experimente zeigen das die LeistungsfĂ€higkeit eines Systems zur FußgĂ€ngererkennung durch die Verwendung von dichtem Stereo verbessert werden kann. Die Vorgestellten Verfahren zur Pfadvorhersage und Absichtserkennung ermöglichen ein frĂŒhzeitiges erkenne der FußgĂ€ngerabsicht. Die ZuverlĂ€ssigkeit zukĂŒnftiger System fĂŒr den Aktiven FußgĂ€ngerschutz, die durch Aktiven Lenkeingriff oder Notbremsemanöver UnfĂ€lle vermeiden, kann mit den vorgestellten Verfahren verbessert werden. Dadurch können UnfĂ€lle vollstĂ€ndig verhindert oder die Schwere einer Kollision reduziert werden

    A variational approach to simultaneous multi-object tracking and classification

    Get PDF
    Object tracking and classification serve as basic components for the different perception tasks of autonomous robots. They provide the robot with the capability of class-aware tracking and richer features for decision-making processes. The joint estimation of class assignments, dynamic states and data associations results in a computationally intractable problem. Therefore, the vast majority of the literature tackles tracking and classification independently. The work presented here proposes a probabilistic model and an inference procedure that render the problem tractable through a structured variational approximation. The framework presented is very generic, and can be used for various tracking applications. It can handle objects with different dynamics, such as cars and pedestrians and it can seamlessly integrate multi-modal features, for example object dynamics and appearance. The method is evaluated and compared with state-of-the-art techniques using the publicly available KITTI dataset

    Compound Models for Vision-Based Pedestrian Recognition

    Get PDF
    This thesis addresses the problem of recognizing pedestrians in video images acquired from a moving camera in real-world cluttered environments. Instead of focusing on the development of novel feature primitives or pattern classifiers, we follow an orthogonal direction and develop feature- and classifier-independent compound techniques which integrate complementary information from multiple image-based sources with the objective of improved pedestrian classification performance. After establishing a performance baseline in terms of a thorough experimental study on monocular pedestrian recognition, we investigate the use of multiple cues on module-level. A motion-based focus of attention stage is proposed based on a learned probabilistic pedestrian-specific model of motion features. The model is used to generate pedestrian localization hypotheses for subsequent shape- and texture-based classification modules. In the remainder of this work, we focus on the integration of complementary information directly into the pattern classification step. We present a combination of shape and texture information by means of pose-specific generative shape and texture models. The generative models are integrated with discriminative classification models by utilizing synthesized virtual pedestrian training samples from the former to enhance the classification performance of the latter. Both models are linked using Active Learning to guide the training process towards informative samples. A multi-level mixture-of-experts classification framework is proposed which involves local pose-specific expert classifiers operating on multiple image modalities and features. In terms of image modalities, we consider gray-level intensity, depth cues derived from dense stereo vision and motion cues arising from dense optical flow. We furthermore employ shape-based, gradient-based and texture-based features. The mixture-of-experts formulation compares favorably to joint space approaches, in view of performance and practical feasibility. Finally, we extend this mixture-of-experts framework in terms of multi-cue partial occlusion handling and the estimation of pedestrian body orientation. Our occlusion model involves examining occlusion boundaries which manifest in discontinuities in depth and motion space. Occlusion-dependent weights which relate to the visibility of certain body parts focus the decision on unoccluded body components. We further apply the pose-specific nature of our mixture-of-experts framework towards estimating the density of pedestrian body orientation from single images, again integrating shape and texture information. Throughout this work, particular emphasis is laid on thorough performance evaluation both regarding methodology and competitive real-world datasets. Several datasets used in this thesis are made publicly available for benchmarking purposes. Our results indicate significant performance boosts over state-of-the-art for all aspects considered in this thesis, i.e. pedestrian recognition, partial occlusion handling and body orientation estimation. The pedestrian recognition performance in particular is considerably advanced; false detections at constant detection rates are reduced by significantly more than an order of magnitude
    • 

    corecore