    Adaptive appearance learning for visual object tracking

    This paper addresses online learning of reference object distribution in the context of two hybrid tracking schemes that combine the mean shift with local point feature correspondences, and the mean shift under the Bayesian framework, respectively. The reference object distribution is built up by a kernel-weighted color histogram. The main contributions of the proposed schemes includes: (a) an adaptive learning strategy that seeks to update the reference object distribution when the changes are caused by the intrinsic object dynamic without partial occlusion/ intersection; (b) novel dynamic maintenance of object feature points by exploring both foreground and background sets; (c) integration of adaptive appearance and local point features in joint object appearance similarity and local point features correspondences-based tracker to improve [7]; (d) integration of adaptive appearance in joint appearance similarity and particle filter tracker under the Bayesian framework to improve [10]. Experimental results on a range of videos captured by a dynamic/stationary camera demonstrate the effectiveness of the proposed schemes in terms of robustness to partial occlusions, tracking drifts and tightness and accuracy of tracked bounding box. Comparisons are also made with the two hybrid trackers together with 3 existing trackers

    View-based models for visual tracking and recognition

    Videovigilância inteligente em ambientes aquáticos : detecção precoce de afogamento em piscinas domésticas

    Tese de doutoramento (área de Informática Industrial)Neste documento, apresenta-se um conjunto de trabalhos relativos à utilização de videovigilância inteligente para a análise de comportamentos humanos em ambientes aquáticos, orientado à detecção precoce de afogamento em piscinas domésticas. Recorrendo a imagens de vídeo capturadas com uma câmara comum de videovigilância e um computador pessoal para efectuar todas as análises necessárias ao reconhecimento de pessoas e à inferência do seu comportamento no ambiente aquático referido de forma autónoma. Trata-se, portanto, de um trabalho baseado em videovigilância inteligente com a capacidade de autonomamente monitorizar as actividades dos utilizadores de uma piscina doméstica despoletando um alerta em caso de detecção de afogamento. A solução apresentada é composta por três módulos principais de processamento que operam de forma sequencial: segmentação de imagens, seguimento de objectos e reconhecimento de comportamento. O primeiro módulo captura uma imagem proveniente de uma câmara e efectua a segmentação fornecendo uma imagem binária com todos os objectos que não pertencem à cena. Neste campo foram desenvolvidas novas técnicas de segmentação de movimento por estimação de background que conseguem eliminar os efeitos das reflexões especulares variáveis e a oscilação da superfície da água muito características de ambientes aquáticos. Neste módulo é ainda efectuado um segundo passo de segmentação dentro do rectângulo que engloba as regiões encontradas na primeira fase da segmentação proporcionando melhoramentos muito significativos nos resultados obtidos através do algoritmo k-means. O segundo módulo, de seguimento de objectos, recebe a imagem binária gerada pelo módulo anterior e identifica cada objecto exclusiva e consecutivamente. Este módulo utiliza um algoritmo de correspondência não balanceado que permite a atribuição dos objectos detectados no fotograma actual aos objectos previstos para o fotograma seguinte. A previsão dos objectos é efectuada por intermédio de um filtro de kalman, sendo a correspondência baseada na similaridade de características dos objectos. Este módulo permite a identificação e seguimento de vários objectos em simultâneo tratando oclusões temporárias parciais e totais. O último módulo recebe as características principais de cada objecto, fornecidas pelo módulo de seguimento, efectua o reconhecimento e inferência do seu comportamento. Este módulo mede várias características dos objectos ao longo do tempo e classifica os padrões encontrados por intermédio de uma árvore de decisão baseada em classificadores naive Bayes. Esta árvore permite assim distinguir pessoas de outros objectos e saber se estão localizados na piscina ou fora da piscina. Por último, para todos os objectos identificados como pessoas que se encontram na piscina, este módulo infere o seu comportamento com base nas decisões da árvore associadas a uma máquina de estados finita. Aquando da detecção de um comportamento de risco, que revele um potencial afogamento, são desencadeados alertas de vários níveis, de acordo com o risco associado. Finalmente foi desenvolvido um protótipo para implementação dos algoritmos desenvolvidos que permite, através de vídeos gravados numa piscina doméstica, testar o completo funcionamento do sistema. Nos vídeos recolhidos foram simuladas situações de afogamento de vários tipos, tendo em atenção as várias fases associadas ao afogamento, de modo a tornar o teste o mais real possível. Os resultados obtidos neste trabalho demonstram a viabilidade da implementação de um sistema para a detecção precoce de afogamento em ambientes domésticos.This document describes all the work carried out in the development of a project of an intelligent video surveillance analytics solution for human behaviour analysis in aquatic environments, dedicated to the early drowning detection at domestic swimming pools. Using video images captured by a standard video surveillance camera and a personal computer to carry out all the needed analysis towards the recognition of people and the deduction of their behaviour in the referred aquatic environment in a completely autonomous way with the ability of generating alarms. The solution devised in this project is composed by three modules operating in a sequential way: image segmentation, object tracking and human behaviour recognition. The first module is responsible for image capturing from a standard video surveillance camera and providing as output a binary image of all objects that do not belong to the background. In this module, new segmentation techniques for background estimation were developed capable of eliminating the problems caused by specular reflections on the water as well the normal oscillation of the surface of the water. In this module, it also shown that a two step segmentation can improve its results in a significant way by the application of the k-means algorithm in the objects obtained in the first step of this module. The second module, object tracking, uses the output of the first module to identify each object in an unequivocal and exclusive way. This module uses an algorithm of non balanced correspondence which allows the establishment of a link of the same object in sequential images. The object location prediction from a frame to the next frame is achieved using a kalman filter, where the link between objects is based in the similarity of the characteristics of those objects. This module allows the unequivocal identification and tracking of several objects at the same time with a robust performance even in the case of total or partial occlusions. The last module input are the main characteristics of each object, which is responsible for the behaviour recognition of each object. Several characteristics of each object are measured over time and the found patterns classified using a decision tree based in naive Bayes classifiers. This decision tree allows the separation between people and other objects as well as knowing if they are located in the water or outside the water. Further, for all objects identified as people, this module analyses its behaviour based on finite state machine. Whenever, a potential early drowning event is detected several alerts are raised according to the calculated risk. Finally, all the modules were integrated in a prototype that is capable of testing the full operation of the solution proposed, using recorded videos in a domestic swimming pool. In the videos several simulations of drowning situations were created in order to emulate the different phases of a drowning event. The results achieved in this project show the viability of the implementation of such a solution for early drowning detection in domestic swimming pools.Fundação para a Ciência e a Tecnologia - Bolsa de Doutoramento com a referência SFRH/BD/28227/200

    Kernel-based method for tracking objects with rotation and translation

