85 research outputs found

    Détection et localisation des panneaux routiers

    Get PDF
    Les panneaux routiers -- Obtention et gestion de la position des panneaux -- Description du système d'inspection et présentation des données -- Le système d'inspection -- Segmentation basée sur la couleur -- Détection des panneaux grâce à leur forme -- Solution proposée pour la détection des panneaux -- Pré-reconnaissance de forme -- Localisation des panneaux dans l'image -- Suivi et localisation des panneaux -- Utilisation de la redonnance temporelle -- Suivi des panneaux -- Localisation des panneaux à posteriori -- Simulation de l'inspection d'une portion de route

    Fusion multi-sources pour l'interprétation d'un environnement routier

    No full text
    Exceeding speed limits is a major cause of road accidents, which could be reduced by the use of robust detection of speed limits that may continuously inform the driver of the proper speed limitation. The work presented in this document relate to the achievement of such a system based on a visual detection of speed limit signs. To make the system robust, it is necessary to merge the results of these detections with information from other sensors to interpret the results of the visual detection. For this aim, two algorithms were developed. First, a specific geographic information system was developed in order to expand the electronic horizon of the vehicle. The fusion process in place addressing these various sources of information is based on model-based rules to overcome the problems inherent to the probabilistic fusion process that can sometimes lead to uncertain situations putting the whole system in global fault. These works are the fruit of collaboration with an automotive supplier and the prototype has been validated experimentally on the road and in real conditions. A ground truth tool has been specially developed to quantify the results. The system shows excellent results with high detection and classification rates for speed limit signs recognition and complex situations analysis.Le dépassement des limitations de vitesse est l'une des causes majeures des accidents de la route, qui pourraient être réduits par l'utilisation de système robuste de détection des limitations de vitesse pouvant continuellement informer le conducteur de la bonne limitation imposée. Les travaux présentés dans ce document portent sur la réalisation d'un tel système basé sur une détection visuelle des panneaux de limitation de vitesse. Afin de rendre le système robuste, il est nécessaire de fusionner les résultats de ces détections avec les informations d'autres capteurs pour interpréter les résultats issus de la détection visuelle. C'est ainsi qu'a été entre autre spécialement développé un capteur cartographique permettant d'avoir une vision plus large sur l'horizon électronique du véhicule, ainsi qu'un système détection des lignes de marquage au sol pour analyser les changements de voie. Le processus de fusion mis en place traitant ces diverses sources d'information est fondé sur des modèles à base de règles permettant de s'affranchir des problèmes inhérents aux processus de fusion probabilistes pouvant parfois mener à des situations de doute mettant le système global en faute. Ces travaux sont le fruit d'une collaboration avec un industriel et le prototype développé a été validé expérimentalement sur route. Un outil de vérité terrain a été spécialement développé pour quantifier les résultats. Le système montre d'excellents résultats en détection et reconnaissance des panneaux de limitation de vitesse ainsi que dans la clarification de situations complexes

    Acquisition 3D et visualisation d'objets culturels pour les applications de la réalité augmentée

    Get PDF
    Au cours des dernières décennies, le domaine de la reconstruction 3D a connu une croissance rapide et de nombreuses techniques ont été présentées par les scientifiques. L'enveloppe visuelle et la stéréovision sont deux de ces techniques, et sont classées parmi les techniques IBMR. Les enveloppes visuelles utilisent la forme d'un objet dérivée des images prises sous différents angles pour créer un modèle 3D approximatif de l'objet. La stéréovision calcule la dimension 3D (profondeur) en comparant deux images de la même scène qui ont été prises sous deux angles différents. Les pixels correspondants dans les deux images sont ensuite calculés pour déduire une carte de disparité qui est utilisée pour déterminer les profondeurs. Les deux techniques présentent des inconvénients lorsqu'elles sont utilisées seules, et l'un des objectifs de cette recherche est de surmonter ces problèmes et de développer une technique de reconstruction 3D efficace et robuste. Notre étude a abouti à la proposition d’une méthode innovante pour estimer l'enveloppe visuelle. Deux approches ont été combinées, à savoir, « la correspondance de caractéristiques » et « l’approche par bloc ». Ce qui a permis de reconstruire des objets avec des gains considérables de temps et sans perte de qualité. Nous avons utilisé les informations géométriques présentes dans les images pour réduire l'espace de recherche des algorithmes stéréoscopiques, réduisant ainsi le temps d'exécution de plus de la moitié du temps initial. Dans le cadre de cette recherche, nous avons eu l’occasion de reconstruire des objets culturels réels et d’intégrer leur modèles 3D à des applications de réalité augmentée.

    Recherche d'information dans les images de documents

    Get PDF
    L'image de document est un objet intelligible qui véhicule de l'information et qui est défini en fonction de son contenu. Cette thèse présente trois modèles de repérage d'information et de recherche d'images pertinentes à la requête d'un utilisateur. Le premier modèle de repérage des zones informationnelles est basé sur l'analyse multi échelle traduisant le contraste visuel des régions sombres par rapport au fond de l'image. Chaque région extraite est définie à partir de son contenu et ses caractéristiques statistiques et géométriques. L'algorithme de classification automatique est amélioré par l'application de règles de production déduites des formes des objets extraits. Une première évaluation de l'extraction du texte, des logos et des photographies sur les images de l'équipe Média Team de l'Université de Washington (UW-1) montre des résultats encourageants. Le deuxième modèle est basé sur le texte obtenu par Reconnaissance Optique de Caractères (OCR). Des erreurs-grammes et des règles de production modélisant les erreurs de reconnaissance de l'OCR sont utilisées pour l'extension des mots de la requête. Le modèle vectoriel est alors appliqué pour modéliser le texte OCR des images de documents et la requête pour la recherche d'information (RI). Un apprentissage sur les images Média Team (UW-2) et des tests sur un millier d'images Web ont validé cette approche. Les résultats obtenus indiquent une nette amélioration comparés aux méthodes standards comme le modèle vectoriel sans l'expansion de la requête et la méthode de recouvrement 3-grams. Pour les zones non textuelles, un troisième modèle vectoriel, basé sur les variations des paramètres de l'opérateur multi-échelle SKCS(Separable Kernel with Compact Support) et une combinaison de classifieurs et d'analyse de sous-espace en composantes principales MKL (Multi-espace Karhunen-Loeve) est appliqué sur une base d'apprentissage d'images de documents de Washington University et de pages Web. Les expériences ont montré une supériorité de l'interprétation et la puissance des vecteurs d'indexations déduits de la classification et représentant les zones non textuelles de l'image. Finalement, un système hybride d'indexation combinant les modèles textuels et non-textuels a été introduit pour répondre à des requêtes plus complexes portant sur des parties de l'image de documents telles un texte, une illustration, un logo ou un graphe. Les expériences ont montré la puissance d'interrogation par des mots ou des images requêtes et ont permis d'aboutir à des résultats encourageants dans la recherche d'images pertinentes qui surpassent ceux obtenus par les méthodes traditionnelles comme révèle une évaluation des rappels vs. précision conduite sur des requêtes portant sur des images de documents

    L’apport des nouvelles technologies de reconnaissances d’images et d’indexation à la recherche historique et à la diffusion des archives photographiques

    Get PDF
    L’indexation et la diffusion des images sont en constante évolution dans le domaine de l’archivistique et de la recherche en histoire. En effet, la numérisation des archives photographiques et l’explosion de la photographie numérique nous obligent à réfléchir à l’intégration de nouvelles méthodes pour l’indexation de ces images. Ce travail de recherche se penche donc sur la perspective d’améliorer l’accessibilité des archives photographiques et leur potentiel pour la recherche historique grâce à l’apport des nouvelles technologies de reconnaissances d’images et d’indexation. Afin d’éviter que cette richesse archivistique demeure sous-exploitée, les centres auront besoin de nouveaux outils pour favoriser la diffusion de ces images. Ce mémoire propose donc une réflexion sur les concepts et les méthodes d’indexation et sur l’état des techniques d’intelligence artificielle permettant la reconnaissance d’images. Une telle approche permettra d’ajouter une liste de mots automatique dans les échelons supérieurs de la taxonomie, offrant ainsi une plus grande cohérence et une meilleure uniformité entre les collections. L’indexation humaine des sujets plus pointus faciliteront ensuite la recherche ciblée dans les collections et ainsi rendra les documents plus accessibles aux chercheurs. Ceux-ci pourront ainsi exécuter des recherches plus prévisibles dans les grandes catégories d’information et disposer d’informations précises pour les recherches ciblées. Bref, l’ajout des technologies de reconnaissance de formes et d’indexation automatisée va favoriser la diffusion des images, mais aussi, la démocratisation du savoir. Elles établissent une complémentarité entre le travail des archivistes, la mise en ligne des sources et les besoins des chercheurs

    Algorithmes pour la modélisation de l'apparence

    Get PDF
    • …
    corecore