16 research outputs found

    Analyse multirésolution et recherche d'images

    Get PDF
    L'objectif de ce mémoire est de développer une méthode rapide et efficace de recherche d'images par contenu. Cette méthode sera utilisée pour des images 1D et pour des images 2D dont les caractéristiques seront représentées par des images 1D. Une image 1D est un signal ou une fonction définie sur un intervalle. Elle peut être représentée par une fonction constante par morceaux, c'est-à-dire une fonction étagée. L'analyse multirésolution est une décomposition de cette fonction étagée suivant des ensembles de fonctions qui font apparaître les détails de l'image 1D en fonction des niveaux de résolution différents. Cette analyse multirésolution est produite grâce à une transformation en ondelettes de Haar qui décompose l'image 1D en ses composantes à différentes échelles. La compression par approximation s'effectue sur le nombre de coefficients de l'image 1D normalisée et décomposée. Si on néglige certains coefficients représentant les détails les plus fins, il est possible d'avoir une bonne approximation de l'image 1D. Nous établissons un processus automatisé de recherche d'images par contenu qui s'applique à de grosses bases de données (BD). On choisit pour cela une métrique qui sera calculée d'une façon rapide entre la requête et les images de la BD. Afin de calculer notre métrique, nous associons à cette dernière des poids déterminés par un modèle de régression logistique. Notre base de données d'images 1D est constituée par des mixtures de gaussiennes. Dans chaque mixture de gaussiennes, le nombre de composantes est identique au nombre de modes apparents. Pour évaluer notre méthode de recherche, nous avons étudié l'effet de plusieurs facteurs tels la translation, l'influence des poids, etc. Afin de tester l'efficacité et l'utilité de notre méthode de recherche, nous appliquons cette dernière pour une base de données de poissons de Surray et une base de données d'images couleurs

    Recherche d'images par le contenu, analyse multirésolution et modèles de régression logistique

    Get PDF
    Cette thèse, présente l'ensemble de nos contributions relatives à la recherche d'images par le contenu à l'aide de l'analyse multirésolution ainsi qu'à la classification linéaire et nonlinéaire. Dans la première partie, nous proposons une méthode simple et rapide de recherche d'images par le contenu. Pour représenter les images couleurs, nous introduisons de nouveaux descripteurs de caractéristiques qui sont des histogrammes pondérés par le gradient multispectral. Afin de mesurer le degré de similarité entre deux images d'une façon rapide et efficace, nous utilisons une pseudo-métrique pondérée qui utilise la décomposition en ondelettes et la compression des histogrammes extraits des images. Les poids de la pseudo-métrique sont ajustés à l'aide du modèle classique de régression logistique afin d'améliorer sa capacité à discriminer et la précision de la recherche. Dans la deuxième partie, nous proposons un nouveau modèle bayésien de régression logistique fondé sur une méthode variationnelle. Une comparaison de ce nouveau modèle au modèle classique de régression logistique est effectuée dans le cadre de la recherche d'images. Nous illustrons par la suite que le modèle bayésien permet par rapport au modèle classique une amélioration notoire de la capacité à discriminer de la pseudo-métrique et de la précision de recherche. Dans la troisième partie, nous détaillons la dérivation du nouveau modèle bayésien de régression logistique fondé sur une méthode variationnelle et nous comparons ce modèle au modèle classique de régression logistique ainsi qu'à d'autres classificateurs linéaires présents dans la littérature. Nous comparons par la suite, notre méthode de recherche, utilisant le modèle bayésien de régression logistique, à d'autres méthodes de recherches déjà publiées. Dans la quatrième partie, nous introduisons la sélection des caractéristiques pour améliorer notre méthode de recherche utilisant le modèle introduit ci-dessus. En effet, la sélection des caractéristiques permet de donner automatiquement plus d'importance aux caractéristiques qui discriminent le plus et moins d'importance aux caractéristiques qui discriminent le moins. Finalement, dans la cinquième partie, nous proposons un nouveau modèle bayésien d'analyse discriminante logistique construit à l'aide de noyaux permettant ainsi une classification nonlinéaire flexible

    Graph Attention Network for Camera Relocalization on Dynamic Scenes

    Full text link
    We devise a graph attention network-based approach for learning a scene triangle mesh representation in order to estimate an image camera position in a dynamic environment. Previous approaches built a scene-dependent model that explicitly or implicitly embeds the structure of the scene. They use convolution neural networks or decision trees to establish 2D/3D-3D correspondences. Such a mapping overfits the target scene and does not generalize well to dynamic changes in the environment. Our work introduces a novel approach to solve the camera relocalization problem by using the available triangle mesh. Our 3D-3D matching framework consists of three blocks: (1) a graph neural network to compute the embedding of mesh vertices, (2) a convolution neural network to compute the embedding of grid cells defined on the RGB-D image, and (3) a neural network model to establish the correspondence between the two embeddings. These three components are trained end-to-end. To predict the final pose, we run the RANSAC algorithm to generate camera pose hypotheses, and we refine the prediction using the point-cloud representation. Our approach significantly improves the camera pose accuracy of the state-of-the-art method from 0.3580.358 to 0.5060.506 on the RIO10 benchmark for dynamic indoor camera relocalization

    Recherche d'images par le contenu, analyse multirésolution et modèles de régression logistique

    No full text
    Cette thèse, présente l'ensemble de nos contributions relatives à la recherche d'images par le contenu à l'aide de l'analyse multirésolution ainsi qu'à la classification linéaire et nonlinéaire. Dans la première partie, nous proposons une méthode simple et rapide de recherche d'images par le contenu. Pour représenter les images couleurs, nous introduisons de nouveaux descripteurs de caractéristiques qui sont des histogrammes pondérés par le gradient multispectral. Afin de mesurer le degré de similarité entre deux images d'une façon rapide et efficace, nous utilisons une pseudo-métrique pondérée qui utilise la décomposition en ondelettes et la compression des histogrammes extraits des images. Les poids de la pseudo-métrique sont ajustés à l'aide du modèle classique de régression logistique afin d'améliorer sa capacité à discriminer et la précision de la recherche. Dans la deuxième partie, nous proposons un nouveau modèle bayésien de régression logistique fondé sur une méthode variationnelle. Une comparaison de ce nouveau modèle au modèle classique de régression logistique est effectuée dans le cadre de la recherche d'images. Nous illustrons par la suite que le modèle bayésien permet par rapport au modèle classique une amélioration notoire de la capacité à discriminer de la pseudo-métrique et de la précision de recherche. Dans la troisième partie, nous détaillons la dérivation du nouveau modèle bayésien de régression logistique fondé sur une méthode variationnelle et nous comparons ce modèle au modèle classique de régression logistique ainsi qu'à d'autres classificateurs linéaires présents dans la littérature. Nous comparons par la suite, notre méthode de recherche, utilisant le modèle bayésien de régression logistique, à d'autres méthodes de recherches déjà publiées. Dans la quatrième partie, nous introduisons la sélection des caractéristiques pour améliorer notre méthode de recherche utilisant le modèle introduit ci-dessus. En effet, la sélection des caractéristiques permet de donner automatiquement plus d'importance aux caractéristiques qui discriminent le plus et moins d'importance aux caractéristiques qui discriminent le moins. Finalement, dans la cinquième partie, nous proposons un nouveau modèle bayésien d'analyse discriminante logistique construit à l'aide de noyaux permettant ainsi une classification nonlinéaire flexible

    Analyse multirésolution et recherche d'images

    No full text
    L'objectif de ce mémoire est de développer une méthode rapide et efficace de recherche d'images par contenu. Cette méthode sera utilisée pour des images 1D et pour des images 2D dont les caractéristiques seront représentées par des images 1D. Une image 1D est un signal ou une fonction définie sur un intervalle. Elle peut être représentée par une fonction constante par morceaux, c'est-à-dire une fonction étagée. L'analyse multirésolution est une décomposition de cette fonction étagée suivant des ensembles de fonctions qui font apparaître les détails de l'image 1D en fonction des niveaux de résolution différents. Cette analyse multirésolution est produite grâce à une transformation en ondelettes de Haar qui décompose l'image 1D en ses composantes à différentes échelles. La compression par approximation s'effectue sur le nombre de coefficients de l'image 1D normalisée et décomposée. Si on néglige certains coefficients représentant les détails les plus fins, il est possible d'avoir une bonne approximation de l'image 1D. Nous établissons un processus automatisé de recherche d'images par contenu qui s'applique à de grosses bases de données (BD). On choisit pour cela une métrique qui sera calculée d'une façon rapide entre la requête et les images de la BD. Afin de calculer notre métrique, nous associons à cette dernière des poids déterminés par un modèle de régression logistique. Notre base de données d'images 1D est constituée par des mixtures de gaussiennes. Dans chaque mixture de gaussiennes, le nombre de composantes est identique au nombre de modes apparents. Pour évaluer notre méthode de recherche, nous avons étudié l'effet de plusieurs facteurs tels la translation, l'influence des poids, etc. Afin de tester l'efficacité et l'utilité de notre méthode de recherche, nous appliquons cette dernière pour une base de données de poissons de Surray et une base de données d'images couleurs

    Coarse-to-Fine Object Tracking Using Deep Features and Correlation filters

    Get PDF
    During the last years, deep learning trackers achieved stimulating results while bringing interesting ideas to solve the tracking problem. This progress is mainly due to the use of learned deep features obtained by training deep convolutional neural networks (CNNs) on large image databases. But since CNNs were originally developed for image classification, appearance modeling provided by their deep layers might be not enough discriminative for the tracking task. In fact,such features represent high-level information, that is more related to object category than to a specific instance of the object. Motivated by this observation, and by the fact that discriminative correlation filters(DCFs) may provide a complimentary low-level information, we presenta novel tracking algorithm taking advantage of both approaches. We formulate the tracking task as a two-stage procedure. First, we exploit the generalization ability of deep features to coarsely estimate target translation, while ensuring invariance to appearance change. Then, we capitalize on the discriminative power of correlation filters to precisely localize the tracked object. Furthermore, we designed an update control mechanism to learn appearance change while avoiding model drift. We evaluated the proposed tracker on object tracking benchmarks. Experimental results show the robustness of our algorithm, which performs favorably against CNN and DCF-based trackers. Code is available at: https://github.com/AhmedZgaren/Coarse-to-fine-Tracke
    corecore