64 research outputs found

    Segmentation et classification de points 3D obtenus à partir de relevés laser terrestres : une approche par super-voxels

    Get PDF
    Session "Posters"National audienceUne méthode de classification de données 3D éparses obtenues à partir de relevés laser terrestres en environment urbain est présentée. Elle est fondée sur une technique de segmentation manipulant des super-voxels. Le nuage de points 3D est tout d'abord divisé en voxels caractérisés par plusieurs attributs. Ils deviennent des super-voxels qui sont liés entre eux pour former des objets par une méthode de chainage plutôt que par une croissance de régions classique. Ces objets sont ensuite classifiés à partir de modèles géométriques et des descripteurs locaux. Afin d'évaluer les résultats, une nouvelle métrique est introduite. Elle caractérise à la fois les résultats de la segmentation et de la classification. L'influence sur les résultats de classification de la taille du voxel et de l'incorporation des informations couleur RVB et intensité de réflectance dans le super-voxel est aussi analysé

    Cartographie urbaine 3D : détection et analyse des évolutions de l'environnement pour la mise à jour automatique

    Get PDF
    National audienceCet article présente une méthode automatique de détection et d'analyse des changements qui surviennent dans les scènes urbaines. Ils sont intégrés progressivement par mise à jour incrémentale de la carte 3D. Les nuages de points 3D, acquis lors de passages successifs en un même lieu mais à des jours et horaires différents, sont combinés pour enrichir la cartographie. Les modifications qui se produisent dans la scène au cours de cette période sont détectées et analysées à l'aide de fonctions cognitives de similarité. Les résultats, évalués sur des données réelles en utilisant différentes métriques, démontrent non seulement l'efficacité du procédé mais attestent que les changements qui peuvent intervenir sont effectivement incorporés dans la cartographie 3D résultante. Ainsi, seules les entités permanentes subsistent dans la carte. La méthode proposée est facilement applicable et adaptée pour opérer sur des scènes urbaines de grande taille

    Clustering de visages : vers la construction automatique d'un album photo à partir d'une s equence vidé o

    Get PDF
    National audienceThis paper presents a clustering method of detections of the same object seen on a video. We apply it to the context of the automatic construction of photo album. We use a global analysis, based on a probabilistic framework of data association problems. The solution is given by Maximum A Posteriori estimation. Our main contribution concerns the use of a local front-back tracking, applied to each detection ; to increase appearance information of detections with a spatial information, through local tracks construction. We introduce a new likelihood measure based on the spatio-temporal dissimilarity between tracks. The algorithm is then able to deal with situations in which the face detections are scattered. We propose to use criteria derived from purity and inverse purity of a clustering to assess performances of the proposed method. This method is compared to hierarchical clustering on two real test sequences.Cet article présente une méthode de regroupement de détections d'un même objet vu sur une séquence vidéo, en se plaçant dans le cadre applicatif plus précis de la construction automatique d'un album photo. Nous utilisons une méthode d'analyse globale, basée sur une formalisation probabiliste du problème d'association de données. La solution du problème est alors donnée par une estimation du Maximum A Posteriori (MAP). La principale contribution concerne l'utilisation d'une méthode de suivi locale avant-arrière appliquée à chaque détection. Cela afin d'enrichir l'information d'apparence issue de la détection, par une information spatiale provenant de la construction de pistes locales. Nous introduisons une nouvelle mesure de vraisemblance basée sur la dissimilarité spatio-temporelle entre les pistes. L'algorithme obtenu est alors capable d'adresser des situations où les détections de visages sont éparses. Nous proposons d'utiliser des critères dérivés de la pureté et la pureté inverse d'un clustering pour évaluer les performances de la méthode proposée. La méthode est ensuite comparée à un clustering ascendant hiérarchique, sur deux séquences test réelles

    Suivi de visages par regroupement de détections : traitement séquentiel par blocs

    Get PDF
    Session "Posters"National audienceCet article décrit une méthode de partitionnement des visages d'une séquence vidéo; elle se base sur une méthode de type tracking-by-detections et utilise une modélisation probabiliste de type Maximum A Posteriori, résolu par un algorithme s'appuyant sur une recherche de flot de coût minimal sur un graphe. Face aux contraintes de densité, mouvement et taille des détections de visage issues de la vidéosurveillance, les travaux présentés apportent deux contributions : (1) la définition de différentes dissimilarités (spatiale, temporelle, apparence et mouvement) combinées de façon simple et (2) la mise en œuvre d'une version séquentielle par blocs d'images qui permet de traiter des flux vidéos. La méthode proposée est évaluée sur plusieurs séquences réelles annotées

    Suivi visuel multi-cibles par partitionnement de détections (application à la construction d'albums de visages)

    Get PDF
    Ce mémoire décrit mes travaux de thèse menés au sein de l'équipe ComSee (Computers that See) rattachée à l'axe ISPR (Image, Systèmes de Perception et Robotique) de l'Institut Pascal. Celle-ci a été financée par la société Vesalis par le biais d'une convention CIFRE avec l'Institut Pascal, subventionnée par l'ANRT (Association Nationale de la Recherche et de la Technologie). Les travaux de thèse s'inscrivent dans le cadre de l'automatisation de la fouille d'archives vidéo intervenant lors d'enquêtes policières. L'application rattachée à cette thèse concerne la création automatique d'un album photo des individus apparaissant sur une séquence de vidéosurveillance. En s'appuyant sur un détecteur de visages, l'objectif est de regrouper par identité les visages détectés sur l'ensemble d'une séquence vidéo. Comme la reconnaissance faciale en environnement non-contrôlé reste difficilement exploitable, les travaux se sont orientés vers le suivi visuel multi-cibles global basé détections. Ce type de suivi est relativement récent. Il fait intervenir un détecteur d'objets et traite la vidéo dans son ensemble (en opposition au traitement séquentiel couramment utilisé). Cette problématique a été représentée par un modèle probabiliste de type Maximum A Posteriori. La recherche de ce maximum fait intervenir un algorithme de circulation de flot sur un graphe, issu de travaux antérieurs. Ceci permet l'obtention d'une solution optimale au problème (défini par l'a posteriori) du regroupement des détections pour le suivi. L'accent a particulièrement été mis sur la représentation de la similarité entre les détections qui s'intègre dans le terme de vraisemblance du modèle. Plusieurs mesures de similarités s'appuyant sur différents indices (temps, position dans l'image, apparence et mouvement local) ont été testées. Une méthode originale d'estimation de ces similarités entre les visages détectés a été développée pour fusionner les différentes informations et s'adapter à la situation rencontrée. Plusieurs expérimentations ont été menées sur des situations complexes, mais réalistes, de scènes de vidéosurveillance. Même si les qualités des albums construits ne satisfont pas encore à une utilisation pratique, le système de regroupement de détections mis en œuvre au cours de cette thèse donne déjà une première solution. Grâce au point de vue partitionnement de données adopté au cours de cette thèse, le suivi multi-cibles développé permet une extension simple à du suivi autre que celui des visages.This report describes my thesis work conducted within the ComSee (Computers That See) team related to the ISPR axis (ImageS, Perception Systems and Robotics) of Institut Pascal. It was financed by the Vesalis company via a CIFRE (Research Training in Industry Convention) agreement with Institut Pascal and publicly funded by ANRT (National Association of Research and Technology). The thesis was motivated by issues related to automation of video analysis encountered during police investigations. The theoretical research carried out in this thesis is applied to the automatic creation of a photo album summarizing people appearing in a CCTV sequence. Using a face detector, the aim is to group by identity all the faces detected throughout the whole video sequence. As the use of facial recognition techniques in unconstrained environments remains unreliable, we have focused instead on global multi-target tracking based on detections. This type of tracking is relatively recent. It involves an object detector and global processing of the video (as opposed to sequential processing commonly used). This issue has been represented by a Maximum A Posteriori probabilistic model. To find an optimal solution of Maximum A Posteriori formulation, we use a graph-based network flow approach, built upon third-party research. The study concentrates on the definition of inter-detections similarities related to the likelihood term of the model. Multiple similarity metrics based on different clues (time, position in the image, appearance and local movement) were tested. An original method to estimate these similarities was developed to merge these various clues and adjust to the encountered situation. Several experiments were done on challenging but real-world situations which may be gathered from CCTVs. Although the quality of generated albums do not yet satisfy practical use, the detections clustering system developed in this thesis provides a good initial solution. Thanks to the data clustering point of view adopted in this thesis, the proposed detection-based multi-target tracking allows easy transfer to other tracking domains.CLERMONT FD-Bib.électronique (631139902) / SudocSudocFranceF

    Segmentation d'images de profondeur : une approche pyramidale

    Get PDF
    Cet article présente un algorithme de segmentation d'images de profondeur en surfaces planes. Les originalités de la méthode reposent sur le procédé d'estimation des attributs différentiels et sur le choix des germes de la croissance de régions. L'algorithme procède en deux temps. Dans un premier temps, les pixels sont regroupés en régions homogènes au sens d'attributs locaux déduits des données initiales. Les régions extraites sont représentées par un graphe d'adjacence. Dans un second temps, une stratégie pyramidale de fusion est mise en oeuvre pour aboutir au résultat de la segmentation. A l'aide de la méthodologie proposée dans [4], une évaluation quantitative des résultats a été menée sur un jeu de 80 images réelles issues de deux capteurs différents. Les résultats de cette étude sont présentés et comparés à ceux obtenus par d'autres techniques

    Application de la théorie de l'évidence à la combinaison de segmentations en régions

    Get PDF
    Cet article présente un algorithme de combinaison de segmentations décrites sous la forme de régions. La théorie de l'évidence est le cadre théorique de cette étude. La probabilité d'appartenance de chaque pixel à une région voisine permet de déduire le jeu de masse associé à une segmentation. Les jeux de masse ainsi obtenus sont combinés par la règle de Dempster. Le critère du maximum de plausibilité permet de choisir l'étiquette définitive du pixel. Une évaluation quantitative et comparative de l'apport de la combinaison a été menée sur un jeu de 40 images réelles

    Merging fuzzy information : application to guidance of agricultural vehicles

    Get PDF
    This Paper presents an application of automatic guidance of a combine harvester by data fusion. Both a laser rangefinder and a monochromatic camera provide redundant information. The problem of feature combination is presented: three models are proposed (probabilities, possibilities and Dempster Shafer theory). A reliability criteria, associated with each sensor data is used into a fuzzy based reasonning system in order to decide what to do: driving the machine using sensor data, driving the machine using prediction information or setting an alarm and let the operator driving it.Cet article concerne une application d'aide au guidage d'une moissonneuse batteuse par fusion de capteurs. L'utilisation d'une caméra et d'un télémètre laser fournit des mesures indépendantes et redondantes. La formalisation d'un problème de fusion d'attributs issus du traitement d'images est présentée et trois modèles sont proposés (modèle probabiliste, modèle possibiliste et modèle basé sur la théorie de l'évidence). La prise en compte de la fiabilité associée aux mesures capteurs est utilisée dans la mise en oeuvre d'un module de raisonnement flou afin de décider si la connaissance que l'on a de la scène permet de commander le véhicule ou s'il faut rendre la main au conducteur
    • …
    corecore