Search CORE

1 research outputs found

A video self-descriptor based on sparse trajectory clustering

Author: Figueiredo Ana Mara de Oliveira
Publication venue: 'Revista Educacao em Foco (UFJF)'
Publication date: 10/09/2015
Field of study

Human action recognition is a challenging problem in Computer Vision which has many potential applications. In order to describe the main movement of the video a new motion descriptor is proposed in this work. We combine two methods for estimating the motion between frames: block matching and brightness gradient of image. In this work we use a variable size block matching algorithm to extract displacement vectors as a motion information. The cross product between the block matching vector and the gra dient is used to obtain the displacement vectors. These vectors are computed in a frame sequence, obtaining the block trajectory which contains the temporal information. The block matching vectors are also used to cluster the sparse trajectories according to their shape. The proposed method computes this information to obtain orientation tensors and to generate the ﬁnal descriptor. It is called self-descriptor because it depends only on the input video. The global tensor descriptor is evaluated by classiﬁcation of KTH, UCF11 and Hollywood2 video datasets with a non-linear SVM classiﬁer. Results indicate that our sparse trajectories method is competitive in comparison to the well known dense tra jectories approach, using orientation tensors, besides requiring less computational eﬀort.O reconhecimento de ações humanas é um problema desaﬁador em visão computacional que tem potenciais áreas de aplicações. Para descrever o principal movimento do vídeo um novo descritor de movimento é proposto neste trabalho. Este trabalho combina dois métodos para estimar o movimento entre as imagens: casamento de blocos e de gradiente de intensidade de brilho da imagem. Neste trabalho usa-se um algoritmo de casamento de blocos de tamanho variável para extrair vetores de deslocamento, os quais contém a informação de movimento. Estes vetores são computados em uma sequência de frames obtendo a trajetória do bloco, que possui a informação temporal. Os vetores obtidos através do casamento de blocos são usados para clusterizar as trajetórias esparsas de acordo com a forma. O método proposto computa essa informação para obter tensores de orientação e gerar o descritor ﬁnal. Este descritor é chamado de autodescritor porque depende apenas do vídeo de entrada. O tensor usado como descritor global é avaliado através da classiﬁcação dos vídeos das bases de dados KTH, UCF11 e Hollywood2 com o classiﬁcador não linear SVM. Os resultados indicam que este método de trajetórias esparsas é competitivo comparado ao já conhecido método de trajetórias densas, usando tensores de orientação, além de requerer menos esforço computacional.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superio

Repositório Institucional - UFJF