    Seguimiento visual de objetos articulados utilizando modelos gráficos basados en energía

    El seguimiento visual de objetos es un tema de interés en el campo de visión por computador, debido a que permite fortalecer las líneas de investigación de reconocimiento de acciones, resumen de video o detección de eventos. Además por su utilidad en aplicaciones como sistemas de monitoreo de personas, edificaciones o tráfico vehicular, que utilizan sistemas de visión, donde resulta importante un método de seguimiento automático para apoyar la tarea de vigilancia o supervisión en el cuidado de ancianos, niños o personas enfermas. Esta investigación esta centrada en el desarrollo de un sistema computacional capaz de localizar y seguir un objeto a través de una secuencia de video, utilizando un modelo de grafos basado en un modelo de energía. Este sistema está enfocado en seguir objetos relevantes presentes en el video, dándole prioridad a elementos sobresalientes con respecto al fondo, en movimiento, en primer plano, entre otras características predominantes. Para el sistema, un objeto está delimitado por un contorno sin forma fija, con el fin de adaptar la localización resultante a la forma precisa del objeto. El rendimiento de este modelo se ha verificado en tres conjuntos de videos Cars-MoSeg, SegTrack y un conjunto propio MCCD, obteniendo resultados comparables con investigaciones similares. El buen desempeño del algoritmo en la tarea de seguimiento se ha demostrado cualitativamente presentando algunas secuencias de imágenes

    Joint Target Tracking and Recognition Using Shape-based Generative Model

    Recently a generative model that combines both of identity and view manifolds was proposed for multi-view shape modeling that was originally used for pose estimation and recognition of civilian vehicles from image sequences. In this thesis, we extend this model to both civilian and military vehicles, and examine its effectiveness for real-world automated target tracking and recognition (ATR) applications in both infrared and visible image sequences. A particle filter-based ATR algorithm is introduced where the generative model is used for shape interpolation along both the view and identity manifolds. The ATR algorithm is tested on the newly released SENSIAC (Military Sensing Information Analysis Center) infrared database along with some visible-band image sequences. Overall tracking and recognition performance is evaluated in terms of the accuracy of 3D position/pose estimation and target classification.

    Compression, pose tracking, and halftoning

    In this thesis, we discuss image compression, pose tracking, and halftoning. Although these areas seem to be unrelated at first glance, they can be connected through video coding as application scenario. Our first contribution is an image compression algorithm based on a rectangular subdivision scheme which stores only a small subsets of the image points. From these points, the remained of the image is reconstructed using partial differential equations. Afterwards, we present a pose tracking algorithm that is able to follow the 3-D position and orientation of multiple objects simultaneously. The algorithm can deal with noisy sequences, and naturally handles both occlusions between different objects, as well as occlusions occurring in kinematic chains. Our third contribution is a halftoning algorithm based on electrostatic principles, which can easily be adjusted to different settings through a number of extensions. Examples include modifications to handle varying dot sizes or hatching. In the final part of the thesis, we show how to combine our image compression, pose tracking, and halftoning algorithms to novel video compression codecs. In each of these four topics, our algorithms yield excellent results that outperform those of other state-of-the-art algorithms.In dieser Arbeit werden die auf den ersten Blick vollkommen voneinander unabhängig erscheinenden Bereiche Bildkompression, 3D-Posenschätzung und Halbtonverfahren behandelt und im Bereich der Videokompression sinnvoll zusammengeführt. Unser erster Beitrag ist ein Bildkompressionsalgorithmus, der auf einem rechteckigen Unterteilungsschema basiert. Dieser Algorithmus speichert nur eine kleine Teilmenge der im Bild vorhandenen Punkte, während die restlichen Punkte mittels partieller Differentialgleichungen rekonstruiert werden. Danach stellen wir ein Posenschätzverfahren vor, welches die 3D-Position und Ausrichtung von mehreren Objekten anhand von Bilddaten gleichzeitig verfolgen kann. Unser Verfahren funktioniert bei verrauschten Videos und im Falle von Objektüberlagerungen. Auch Verdeckungen innerhalb einer kinematischen Kette werden natürlich behandelt. Unser dritter Beitrag ist ein Halbtonverfahren, das auf elektrostatischen Prinzipien beruht. Durch eine Reihe von Erweiterungen kann dieses Verfahren flexibel an verschiedene Szenarien angepasst werden. So ist es beispielsweise möglich, verschiedene Punktgrößen zu verwenden oder Schraffuren zu erzeugen. Der letzte Teil der Arbeit zeigt, wie man unseren Bildkompressionsalgorithmus, unser Posenschätzverfahren und unser Halbtonverfahren zu neuen Videokompressionsalgorithmen kombinieren kann. Die für jeden der vier Themenbereiche entwickelten Verfahren erzielen hervorragende Resultate, welche die Ergebnisse anderer moderner Verfahren übertreffen