2,049 research outputs found
Action Recognition in Videos: from Motion Capture Labs to the Web
This paper presents a survey of human action recognition approaches based on
visual data recorded from a single video camera. We propose an organizing
framework which puts in evidence the evolution of the area, with techniques
moving from heavily constrained motion capture scenarios towards more
challenging, realistic, "in the wild" videos. The proposed organization is
based on the representation used as input for the recognition task, emphasizing
the hypothesis assumed and thus, the constraints imposed on the type of video
that each technique is able to address. Expliciting the hypothesis and
constraints makes the framework particularly useful to select a method, given
an application. Another advantage of the proposed organization is that it
allows categorizing newest approaches seamlessly with traditional ones, while
providing an insightful perspective of the evolution of the action recognition
task up to now. That perspective is the basis for the discussion in the end of
the paper, where we also present the main open issues in the area.Comment: Preprint submitted to CVIU, survey paper, 46 pages, 2 figures, 4
table
Visual attention and swarm cognition for off-road robots
Tese de doutoramento, Informática (Engenharia Informática), Universidade de Lisboa, Faculdade de Ciências, 2011Esta tese aborda o problema da modelação de atenção visual no contexto de robôs autónomos todo-o-terreno. O objectivo de utilizar mecanismos de atenção visual é o de focar a percepção nos aspectos do ambiente mais relevantes à tarefa do robô. Esta tese mostra que, na detecção de obstáculos e de trilhos, esta capacidade promove robustez e parcimónia computacional. Estas são características chave para a rapidez e eficiência dos robôs todo-o-terreno. Um dos maiores desafios na modelação de atenção visual advém da necessidade de gerir o compromisso velocidade-precisão na presença de variações de contexto ou de tarefa. Esta tese mostra que este compromisso é resolvido se o processo de atenção visual for modelado como um processo auto-organizado, cuja operação é modulada pelo módulo de selecção de acção, responsável pelo controlo do robô. Ao fechar a malha entre o processo de selecção de acção e o de percepção, o último é capaz de operar apenas onde é necessário, antecipando as acções do robô. Para fornecer atenção visual com propriedades auto-organizadas, este trabalho obtém inspiração da Natureza. Concretamente, os mecanismos responsáveis pela capacidade que as formigas guerreiras têm de procurar alimento de forma auto-organizada, são usados como metáfora na resolução da tarefa de procurar, também de forma auto-organizada, obstáculos e trilhos no campo visual do robô. A solução proposta nesta tese é a de colocar vários focos de atenção encoberta a operar como um enxame, através de interacções baseadas em feromona. Este trabalho representa a primeira realização corporizada de cognição de enxame. Este é um novo campo de investigação que procura descobrir os princípios básicos da cognição, inspeccionando as propriedades auto-organizadas da inteligência colectiva exibida pelos insectos sociais. Logo, esta tese contribui para a robótica como disciplina de engenharia e para a robótica como disciplina de modelação, capaz de suportar o estudo do comportamento adaptável.Esta tese aborda o problema da modelação de atenção visual no contexto de robôs autónomos
todo-o-terreno. O objectivo de utilizar mecanismos de atenção visual é o de focar a percepção
nos aspectos do ambiente mais relevantes à tarefa do robô. Esta tese mostra que, na detecção de
obstáculos e de trilhos, esta capacidade promove robustez e parcimónia computacional. Estas
são características chave para a rapidez e eficiência dos robôs todo-o-terreno.
Um dos maiores desafios na modelação de atenção visual advém da necessidade de gerir o
compromisso velocidade-precisão na presença de variações de contexto ou de tarefa. Esta tese
mostra que este compromisso é resolvido se o processo de atenção visual for modelado como
um processo auto-organizado, cuja operação é modulada pelo módulo de selecção de acção,
responsável pelo controlo do robô. Ao fechar a malha entre o processo de selecção de acção e
o de percepção, o último é capaz de operar apenas onde é necessário, antecipando as acções do
robô.
Para fornecer atenção visual com propriedades auto-organizadas, este trabalho obtém inspi-
ração da Natureza. Concretamente, os mecanismos responsáveis pela capacidade que as formi-
gas guerreiras têm de procurar alimento de forma auto-organizada, são usados como metáfora
na resolução da tarefa de procurar, também de forma auto-organizada, obstáculos e trilhos no
campo visual do robô. A solução proposta nesta tese é a de colocar vários focos de atenção
encoberta a operar como um enxame, através de interacções baseadas em feromona.
Este trabalho representa a primeira realização corporizada de cognição de enxame. Este é
um novo campo de investigação que procura descobrir os princípios básicos da cognição, ins-
peccionando as propriedades auto-organizadas da inteligência colectiva exibida pelos insectos
sociais. Logo, esta tese contribui para a robótica como disciplina de engenharia e para a robótica
como disciplina de modelação, capaz de suportar o estudo do comportamento adaptável.Fundação para a Ciência e a Tecnologia (FCT,SFRH/BD/27305/2006); Laboratory of Agent Modelling (LabMag
GeoTransformer: Fast and Robust Point Cloud Registration with Geometric Transformer
We study the problem of extracting accurate correspondences for point cloud
registration. Recent keypoint-free methods have shown great potential through
bypassing the detection of repeatable keypoints which is difficult to do
especially in low-overlap scenarios. They seek correspondences over downsampled
superpoints, which are then propagated to dense points. Superpoints are matched
based on whether their neighboring patches overlap. Such sparse and loose
matching requires contextual features capturing the geometric structure of the
point clouds. We propose Geometric Transformer, or GeoTransformer for short, to
learn geometric feature for robust superpoint matching. It encodes pair-wise
distances and triplet-wise angles, making it invariant to rigid transformation
and robust in low-overlap cases. The simplistic design attains surprisingly
high matching accuracy such that no RANSAC is required in the estimation of
alignment transformation, leading to times acceleration. Extensive
experiments on rich benchmarks encompassing indoor, outdoor, synthetic,
multiway and non-rigid demonstrate the efficacy of GeoTransformer. Notably, our
method improves the inlier ratio by percentage points and the
registration recall by over points on the challenging 3DLoMatch benchmark.
Our code and models are available at
\url{https://github.com/qinzheng93/GeoTransformer}.Comment: Accepted by TPAMI. Extended version of our CVPR 2022 paper
[arXiv:2202.06688
Global constitutionalism and legal theory: a preliminary analysis
El derecho supranacional presenta fenómenos de fragmentación, además de aspectos de constitucionalización. Las teorías que se ocupan del constitucionalismo global analizan los fenómenos de constitucionalización del derecho supranacional, tal como los requisitos prescriptivos de este proceso. Este artículo versa sobre las diversas maneras en las que es posible comprender el constitucionalismo global y, sobre todo, analiza su relevancia para la teoría y el concepto de derecho.Supranational law shows phenomena of fragmentation, as well as aspects of constitutionalization. Theories that deal with global constitutionalism analyze phenomena of constitutionalization of supranational law, as well as the prescriptive requirements of this process. This paper analyzes the different ways in which it is possible to understand global constitutionalism, and in a preliminary way addresses its relevance to the theory and the concept of law
- …