3 research outputs found
Graph matching using position coordinates and local features for image analysis
Encontrar las correspondencias entre dos imágenes es un problema crucial en el campo de la visiĂłn por ordenador i el reconocimiento de patrones. Es relevante para un amplio rango de propĂłsitos des de aplicaciones de reconocimiento de objetos en las áreas de biometrĂa, análisis de documentos i análisis de formas hasta aplicaciones relacionadas con la geometrĂa desde mĂşltiples puntos de vista tales cĂłmo la recuperaciĂłn de la pose, estructura desde el movimiento y localizaciĂłn y mapeo.
La mayorĂa de las tĂ©cnicas existentes enfocan este problema o bien usando caracterĂsticas locales en la imagen o bien usando mĂ©todos de registro de conjuntos de puntos (o bien una mezcla de ambos). En las primeras, un conjunto disperso de caracterĂsticas es primeramente extraĂdo de las imágenes y luego caracterizado en la forma de vectores descriptores usando evidencias locales de la imagen. Las caracterĂsticas son asociadas segĂşn la similitud entre sus descriptores. En las segundas, los conjuntos de caracterĂsticas son considerados cĂłmo conjuntos de puntos los cuales son asociados usando tĂ©cnicas de optimizaciĂłn no lineal. Estos son procedimientos iterativos que estiman los parámetros de correspondencia y de alineamiento en pasos alternados.
Los grafos son representaciones que contemplan relaciones binarias entre las caracterĂsticas. Tener en cuenta relaciones binarias al problema de la correspondencia a menudo lleva al llamado problema del emparejamiento de grafos. Existe cierta cantidad de mĂ©todos en la literatura destinados a encontrar soluciones aproximadas a diferentes instancias del problema de emparejamiento de grafos, que en la mayorĂa de casos es del tipo "NP-hard".
El cuerpo de trabajo principal de esta tesis está dedicado a formular ambos problemas de asociaciĂłn de caracterĂsticas de imagen y registro de conjunto de puntos como instancias del problema de emparejamiento de grafos. En todos los casos proponemos algoritmos aproximados para solucionar estos problemas y nos comparamos con un nĂşmero de mĂ©todos existentes pertenecientes a diferentes áreas como eliminadores de "outliers", mĂ©todos de registro de conjuntos de puntos y otros mĂ©todos de emparejamiento de grafos.
Los experimentos muestran que en la mayorĂa de casos los mĂ©todos propuestos superan al resto. En ocasiones los mĂ©todos propuestos o bien comparten el mejor rendimiento con algĂşn mĂ©todo competidor o bien obtienen resultados ligeramente peores. En estos casos, los mĂ©todos propuestos normalmente presentan tiempos computacionales inferiores.Trobar les correspondències entre dues imatges Ă©s un problema crucial en el camp de la visiĂł per ordinador i el reconeixement de patrons. És rellevant per un ampli ventall de propòsits des d’aplicacions de reconeixement d’objectes en les Ă rees de biometria, anĂ lisi de documents i anĂ lisi de formes fins aplicacions relacionades amb geometria des de mĂşltiples punts de vista tals com recuperaciĂł de pose, estructura des del moviment i localitzaciĂł i mapeig.
La majoria de les tècniques existents enfoquen aquest problema o bĂ© usant caracterĂstiques locals a la imatge o bĂ© usant mètodes de registre de conjunts de punts (o bĂ© una mescla d’ambdĂłs). En les primeres, un conjunt dispers de caracterĂstiques Ă©s primerament extret de les imatges i desprĂ©s caracteritzat en la forma de vectors descriptors usant evidències locals de la imatge. Les caracterĂstiques son associades segons la similitud entre els seus descriptors. En les segones, els conjunts de caracterĂstiques son considerats com conjunts de punts els quals son associats usant tècniques d’optimitzaciĂł no lineal. Aquests son procediments iteratius que estimen els parĂ metres de correspondència i d’alineament en passos alternats.
Els grafs son representacions que contemplen relacions binaries entre les caracterĂstiques. Tenir en compte relacions binĂ ries al problema de la correspondència sovint porta a l’anomenat problema de l’emparellament de grafs. Existeix certa quantitat de mètodes a la literatura destinats a trobar solucions aproximades a diferents instĂ ncies del problema d’emparellament de grafs, el qual en la majoria de casos Ă©s del tipus “NP-hard”.
Una part del nostre treball estĂ dedicat a investigar els beneficis de les mesures de ``bins'' creuats per a la comparaciĂł de caracterĂstiques locals de les imatges.
La resta estĂ dedicat a formular ambdĂłs problemes d’associaciĂł de caracterĂstiques d’imatge i registre de conjunt de punts com a instĂ ncies del problema d’emparellament de grafs. En tots els casos proposem algoritmes aproximats per solucionar aquests problemes i ens comparem amb un nombre de mètodes existents pertanyents a diferents Ă rees com eliminadors d’“outliers”, mètodes de registre de conjunts de punts i altres mètodes d’emparellament de grafs.
Els experiments mostren que en la majoria de casos els mètodes proposats superen a la resta. En ocasions els mètodes proposats o bé comparteixen el millor rendiment amb algun mètode competidor o bé obtenen resultats lleugerament pitjors. En aquests casos, els mètodes proposats normalment presenten temps computacionals inferiors
Visual information processing during conscious and non-conscious face perception
Les stimuli naturels projetés sur nos rétines nous fournissent de l’information visuelle riche. Cette information varie le long de propriétés de « bas niveau » telles que la luminance, le contraste, et les fréquences spatiales. Alors qu’une partie de cette information atteint notre conscience, une autre partie est traitée dans le cerveau sans que nous en soyons conscients. Les propriétés de l’information influençant l’activité cérébrale et le comportement de manière consciente versus non-consciente demeurent toutefois peu connues. Cette question a été examinée dans les deux derniers articles de la présente thèse, en exploitant les techniques psychophysiques développées dans les deux premiers articles.
Le premier article présente la boîte à outils SHINE (spectrum, histogram, and intensity normalization and equalization), développée afin de permettre le contrôle des propriétés de bas niveau de l'image dans MATLAB. Le deuxième article décrit et valide la technique dite des bulles fréquentielles, qui a été utilisée tout au long des études de cette thèse pour révéler les fréquences spatiales utilisées dans diverses tâches de perception des visages. Cette technique offre les avantages d’une haute résolution au niveau des fréquences spatiales ainsi que d’un faible biais expérimental. Le troisième et le quatrième article portent sur le traitement des fréquences spatiales en fonction de la conscience. Dans le premier cas, la méthode des bulles fréquentielles a été utilisée avec l'amorçage par répétition masquée dans le but d’identifier les fréquences spatiales corrélées avec les réponses comportementales des observateurs lors de la perception du genre de visages présentés de façon consciente versus non-consciente. Les résultats montrent que les mêmes fréquences spatiales influencent de façon significative les temps de réponse dans les deux conditions de conscience, mais dans des sens opposés. Dans le dernier article, la méthode des bulles fréquentielles a été combinée à des enregistrements intracrâniens et au Continuous Flash Suppression (Tsuchiya & Koch, 2005), dans le but de cartographier les fréquences spatiales qui modulent l'activation de structures spécifiques du cerveau (l'insula et l'amygdale) lors de la perception consciente versus non-consciente des expressions faciales émotionnelles. Dans les deux régions, les résultats montrent que la perception non-consciente s'effectue plus rapidement et s’appuie davantage sur les basses fréquences spatiales que la perception consciente.
La contribution de cette thèse est donc double. D’une part, des contributions méthodologiques à la recherche en perception visuelle sont apportées par l'introduction de la boîte à outils SHINE ainsi que de la technique des bulles fréquentielles. D’autre part, des indications sur les « corrélats de la conscience » sont fournies à l’aide de deux approches différentes.Natural stimuli impinging on our retinas provide us with a wealth of visual information. This information varies along “low-level” features, such as luminance, contrast, and spatial frequency (SF). Whereas some of this information reaches our awareness, some of it is processed in the brain without us ever becoming aware of it (i.e., non-consciously). A remaining question is precisely which SFs influence brain activation and behavior consciously vs. non-consciously. The aim of this thesis was to address this question using state-of the-art psychophysical techniques.
The first article introduces the SHINE (spectrum, histogram, and intensity normalization and equalization) toolbox for controlling low-level image properties in MATLAB. The second article describes and validates the SF Bubbles technique, which was used throughout the studies in this thesis to map SF tuning for various face perception tasks with a high SF resolution and low experimental bias. The third and fourth articles focus on SF processing as a function of awareness. In the former, SF Bubbles was employed together with repetition priming and masking to investigate which SFs are correlated with observers’ behavioral responses during conscious vs. non-conscious face-gender perception. The results show that the same SFs significantly influenced response times in both prime awareness conditions but, surprisingly, in opposite ways. In the latter, SF Bubbles was combined with intracranial recordings from awake human patients and Continuous Flash Suppression (Tsuchiya & Koch, 2005). This allowed us to map the SFs that modulate activation in specific brain structures (the insula and the amygdala) during the conscious vs. non-conscious perception of emotional facial expressions. The results for both regions demonstrate that non-conscious perception relied on low SFs more and was faster than conscious perception.
The contribution made in this thesis is thus two-fold: methodological contributions to visual perception research are made by introducing the SHINE toolbox and the SF Bubbles technique, and insights into the “informational correlates” of consciousness are provided from two different angles