2 research outputs found
Angular variation as a monocular cue for spatial percepcion
Monocular cues are spatial sensory inputs which are picked up exclusively from one eye. They are in majority static features that
provide depth information and are extensively used in graphic art to create realistic representations of a scene. Since the spatial
information contained in these cues is picked up from the retinal image, the existence of a link between it and the theory of direct
perception can be conveniently assumed. According to this theory, spatial information of an environment is directly contained in the
optic array. Thus, this assumption makes possible the modeling of visual perception processes through computational approaches.
In this thesis, angular variation is considered as a monocular cue, and the concept of direct perception is adopted by a computer
vision approach that considers it as a suitable principle from which innovative techniques to calculate spatial information can be
developed.
The expected spatial information to be obtained from this monocular cue is the position and orientation of an object with respect to
the observer, which in computer vision is a well known field of research called 2D-3D pose estimation. In this thesis, the attempt to
establish the angular variation as a monocular cue and thus the achievement of a computational approach to direct perception is
carried out by the development of a set of pose estimation methods. Parting from conventional strategies to solve the pose
estimation problem, a first approach imposes constraint equations to relate object and image features. In this sense, two algorithms
based on a simple line rotation motion analysis were developed. These algorithms successfully provide pose information; however,
they depend strongly on scene data conditions. To overcome this limitation, a second approach inspired in the biological processes
performed by the human visual system was developed. It is based in the proper content of the image and defines a computational
approach to direct perception.
The set of developed algorithms analyzes the visual properties provided by angular variations. The aim is to gather valuable data
from which spatial information can be obtained and used to emulate a visual perception process by establishing a 2D-3D metric
relation. Since it is considered fundamental in the visual-motor coordination and consequently essential to interact with the
environment, a significant cognitive effect is produced by the application of the developed computational approach in environments
mediated by technology. In this work, this cognitive effect is demonstrated by an experimental study where a number of participants
were asked to complete an action-perception task. The main purpose of the study was to analyze the visual guided behavior in
teleoperation and the cognitive effect caused by the addition of 3D information. The results presented a significant influence of the
3D aid in the skill improvement, which showed an enhancement of the sense of presence.Las se帽ales monoculares son entradas sensoriales capturadas exclusivamente por un
solo ojo que ayudan a la percepci贸n de distancia o espacio. Son en su mayor铆a
caracter铆sticas est谩ticas que proveen informaci贸n de profundidad y son muy
utilizadas en arte gr谩fico para crear apariencias reales de una escena. Dado que la
informaci贸n espacial contenida en dichas se帽ales son extra铆das de la retina, la
existencia de una relaci贸n entre esta extracci贸n de informaci贸n y la teor铆a de
percepci贸n directa puede ser convenientemente asumida. De acuerdo a esta teor铆a, la
informaci贸n espacial de todo le que vemos est谩 directamente contenido en el arreglo
贸ptico. Por lo tanto, esta suposici贸n hace posible el modelado de procesos de
percepci贸n visual a trav茅s de enfoques computacionales. En esta tesis doctoral, la
variaci贸n angular es considerada como una se帽al monocular, y el concepto de
percepci贸n directa adoptado por un enfoque basado en algoritmos de visi贸n por
computador que lo consideran un principio apropiado para el desarrollo de nuevas
t茅cnicas de c谩lculo de informaci贸n espacial.
La informaci贸n espacial esperada a obtener de esta se帽al monocular es la posici贸n y
orientaci贸n de un objeto con respecto al observador, lo cual en visi贸n por computador
es un conocido campo de investigaci贸n llamado estimaci贸n de la pose 2D-3D. En esta
tesis doctoral, establecer la variaci贸n angular como se帽al monocular y conseguir un
modelo matem谩tico que describa la percepci贸n directa, se lleva a cabo mediante el
desarrollo de un grupo de m茅todos de estimaci贸n de la pose. Partiendo de estrategias
convencionales, un primer enfoque implanta restricciones geom茅tricas en ecuaciones
para relacionar caracter铆sticas del objeto y la imagen. En este caso, dos algoritmos
basados en el an谩lisis de movimientos de rotaci贸n de una l铆nea recta fueron
desarrollados. Estos algoritmos exitosamente proveen informaci贸n de la pose. Sin
embargo, dependen fuertemente de condiciones de la escena. Para superar esta
limitaci贸n, un segundo enfoque inspirado en los procesos biol贸gicos ejecutados por el
sistema visual humano fue desarrollado. Est谩 basado en el propio contenido de la
imagen y define un enfoque computacional a la percepci贸n directa.
El grupo de algoritmos desarrollados analiza las propiedades visuales suministradas
por variaciones angulares. El prop贸sito principal es el de reunir datos de importancia
con los cuales la informaci贸n espacial pueda ser obtenida y utilizada para emular
procesos de percepci贸n visual mediante el establecimiento de relaciones m茅tricas 2D-
3D. Debido a que dicha relaci贸n es considerada fundamental en la coordinaci贸n
visuomotora y consecuentemente esencial para interactuar con lo que nos rodea, un
efecto cognitivo significativo puede ser producido por la aplicaci贸n de m茅todos de
L
estimaci贸n de pose en entornos mediados tecnol贸gicamente. En esta tesis doctoral, este
efecto cognitivo ha sido demostrado por un estudio experimental en el cual un n煤mero
de participantes fueron invitados a ejecutar una tarea de acci贸n-percepci贸n. El
prop贸sito principal de este estudio fue el an谩lisis de la conducta guiada visualmente en
teleoperaci贸n y el efecto cognitivo causado por la inclusi贸n de informaci贸n 3D. Los
resultados han presentado una influencia notable de la ayuda 3D en la mejora de la
habilidad, as铆 como un aumento de la sensaci贸n de presencia