    Image Registration by Combining Thin-Plate Splines With a 3D Morphable Model

    Registering images of a deforming surface is a well-studied problem. It is common practice to describe the image deformation fields with Thin-Plate Splines. This has the advantage to involve small numbers of parameters, but has the drawback that the 3D surface is not explicitly reconstructed. We propose an image deformation model combining Thin-Plate Splines with 3D entities – a 3D control mesh and a camera – overcoming the above mentioned drawback. An original solution to the non-rigid image registration problem using this model is proposed and demonstrated on simulated and real data

    3D Reconstruction of Complex Structures with Bundle Adjustment: an Incremental Approach

    This paper introduces an incremental method for "Structure From Motion" of complex scenes from a video sequence. More precisely, we estimate the 3D positions of the viewed points in images and the camera positions and orientations through the sequence. The method can be seen as a fast but accurate alternative to classical reconstruction methods that use bundle adjustment, and that can become slow and computation time expensive for very long scenes. Our results are compared to the reconstruction obtained by the classical hierarchical bundle adjustment method. They have also been successfully used as a reference sequence for the vision based localization of an autonomous mobile robot

    Détection et localisation d'objets stationnaires par une paire de caméras PTZ

    Session "Articles"National audienceDans ce papier, nous proposons une approche originale pour détecter et localiser des objets stationnaires sur une scène étendue en exploitant une paire de caméras PTZ. Nous proposons deux contributions principales. Tout d'abord, nous présentons une méthode de détection et de segmentation d'objets stationnaires. Celle-ci est basée sur la réidentification de descripteurs de l'avant-plan et une segmentation de ces blobs en objets à l'aide de champs de Markov. La seconde contribution concerne la mise en correspondance entre les deux PTZ des silhouettes d'objets détectées dans chaque image

    Méthode d'apprentissage pour la classification à partir d'exemples positifs

    National audienceCet article présente une méthode d'apprentissage générique et non supervisée à partir d'une seule base d'exemple positif, pour la classification. Le système est formalisé dans un cadre probabiliste. Nous proposons une méthode originale pour approximer la densité de probabilité de la fonction de vraisemblance correspondant aux évènements dit normaux, en utilisant un modèle parcimonieux basé sur des fonctions noyaux. Ce modèle présente l'avantage des méthodes non-paramétriques tout en limitant le coût algorithmique souvent important qui leur est lié. La classification est ensuite effectuée à partir de cette approximation grâce à une notion de confiance. La méthode sera comparée à celle des One Class SVM et testée dans le cas de la détection d'événements rares liés au trafic routier

    Real-Time Localization and 3D Reconstruction

    In this paper we describe a method that estimates the motion of a calibrated camera (settled on an experimental vehicle) and the tridimensional geometry of the environment. The only data used is a video input. In fact, interest points are tracked and matched between frames at video rate. Robust estimates of the camera motion are computed in real-time, key-frames are selected and permit the features 3D reconstruction. The algorithm is particularly appropriate to the reconstruction of long images sequences thanks to the introduction of a fast and local bundle adjustment method that ensures both good accuracy and consistency of the estimated camera poses along the sequence. It also largely reduces computational complexity compared to a global bundle adjustment. Experiments on real data were carried out to evaluate speed and robustness of the method for a sequence of about one kilometer long. Results are also compared to the ground truth measured with a differential GPS

    Audio-Video Event Recognition System For Public Transport Security

    International audienceThis paper presents an audio-video surveillance system for the automatic surveillance in public transport vehicle. The system comprises six modules including in particular three novel ones: (i) Face Detection and Tracking, (ii) Audio Event Detection and (iii) Audio-Video Scenario Recognition. The Face Detection and Tracking module is responsible for detecting and tracking faces of people in front of cameras. The Audio Event Detection module detects abnormal audio events which are precursor for detecting scenarios which have been predefined by end-users. The Audio-Video Scenario Recognition module performs high level interpretation of the observed objects by combining audio and video events based on spatio-temporal reasoning. The performance of the system is evaluated for a series of pre-defined audio, video and audio-video events specified using an audio-video event ontology

    Suivi par ré-identification dans un réseau de caméras à champs disjoints

    Session "Articles"National audienceCet article adresse le problème de suivi automatique de piétons au travers de réseaux de caméras à champs de vue disjoints. Le suivi dans l'image est traité de manière locale par un algorithme de Suivi-par-Détections et ré-identification. Avec du filtrage particulaire à état mixte, nous introduisons la notion d'identité globale dans un algorithme de suivi multi-pistes pour caractériser les personnes au niveau du réseau et pallier aux discontinuités d'observations. Nous venons renforcer la décision de ré-identification en proposant un schéma décisionnel haut niveau intégrant les hypothèses de chaque traqueur confrontées à la topologie du réseau. La composante suivi multi-personnes et ré-identification est d'abord testée en contexte monocaméra. Nous évaluons ensuite notre approche complète sur un réseau de 3 caméras à champs de vue disjoints et un ensemble de 7 personnes. La seule connaissance a priori requise est la carte topologique du réseau

    Real-Time Humans Detection in Urban Scenes

    We address the issue of real-time pedestrians detection in a urban environment. This is a challenging task owing to the high variability of appearances and poses that humans can have and to the complexity of backgrounds. We propose a solution made of gradient-based local descriptors combined to form strong classifiers and organized in a cascaded detector. We developed for this an extension of the Histograms of Oriented Gradients (HOGs) and added a new component to the histogram which represents the strength of edges or the amount of information in the histogram support. We also implemented a learning algorithm based on Real Adaboost where two phases – selection first, then refinement of weights – provide more robustness to the detector. We evaluated our system by comparing it to the cascaded detector of Haar features of Viola & Jones [7] and to the SVM of HOGs features of Dalal & Triggs [1]. To ensure an equitable and valid comparison, we used the database proposed in [1]. Our system outperforms them in detection results and in time needs.