7 research outputs found
UPC system for the 2016 MediaEval multimodal person discovery in broadcast TV task
The UPC system works by extracting monomodal signal segments (face tracks, speech segments) that overlap with the person names overlaid in the video signal. These segments are assigned directly with the name of the person and used as a reference to compare against the non-overlapping (unassigned) signal segments. This process is performed independently both on the speech and video signals. A simple fusion scheme is used to combine both monomodal annotations into a single one.Postprint (published version
Identificaci贸n no-supervisada de personas en programas de TV
The enormous amount of visual data generated nowadays creates a strong need for annotation tools to enable search and retrieval of information present in the videos. One of the most relevant information is the identity of people. The aim of this project is to implement non-supervised algorithms of text and face recognition, to identify relevant people appearing in Broadcast TV. This project achieves avoiding manual annotations with an automatic annotation system.La enorme cantidad de datos visuales generados hoy en d铆a crea una fuerte necesidad de obtener t茅cnicas de anotaci贸n para poder realizar b煤squedas de informaci贸n en los v铆deos. Una de la informaci贸n m谩s relevante es la identidad de las personas. El objetivo de este proyecto es proponer unos algoritmos no supervisados de reconocimiento facial y de texto para la identificaci贸n de las personas en transmisiones de TV, para obtener un sistema de anotaci贸n de v铆deo autom谩tico y as铆 evitar las anotaciones manuales.La enorme quantitat de dades visuals que es genera avui en dia crea una forta necessitat
de obtenir t猫cniques d鈥檃notaci贸 per a poder realitzar cerques d鈥檌nformaci贸 en els v铆deos.
Una de la informaci贸 m茅s rellevant 茅s la identitat de les persones.
L鈥檕bjectiu d鈥檃quest projecte 茅s proposar uns algorismes no supervisats de reconeixement
facial i de text per a la identificaci贸 de les persones en les transmissions de TV, per
obtenir un sistema d鈥檃notaci贸 de v铆deo autom脿tic, i evitar aix铆 les anotacions manuals
Reconocimiento facial no supervisado en programas de televisi贸n
La enorme cantidad de datos visuales que se genera actualmente, especialmente v铆deos, crea
una fuerte necesidad de herramientas de anotaci贸n que hagan posible la b煤squeda y
recuperaci贸
n de informaci贸n presente en dichos datos visuales.
La
anotaci贸n autom谩tica
en
programas de televisi贸n es una funcionalidad clave en aplicaciones de
video
retrieval
sobre
grandes bases de datos visuales. Una de las informaciones m谩s relevantes es la identidad de
las personas. En este contexto,
la anotaci贸n consiste en determinar
de forma autom谩tica
la
identidad y la localizaci贸n temporal de las personas que aparecen en el
programa de televisi贸n
utilizando t茅cnicas de
video tracking
y de
reconocimiento facial
.
En este proyecto se realiza una anotaci贸n autom
谩tica
en programas de televisi贸n
, la cual
consiste
en ir creando
autom谩ticamente
una base de datos con las identidades de las personas
que van apareciendo, donde a cada identidad le asignamos todos los
frames
que pertenecen
a la misma person
a y que se han obtenido de distintos instantes de tiempo.
Cada identidad
tendr谩 asociado su correspondiente nombre.
El
reconocimiento
facial
empleado para identificar
no se supervisa
puesto
que
no interviene
ning煤n
supervisor
externo
que previamente haya e
stablecido unos determinados modelos
de
identidades
con los que comparar para reconocer
, sino que es
la propia base de datos
la que
se
va creando
a partir de la inf
ormaci贸n presente en los v铆deos. Esta informaci贸n es el nombre
de las identidades que van apareciendo.
La t茅cnica de reconocimiento facial utilizada es la llamada
芦
Sparse Representation
禄. Se basa
en im谩genes frontales y es robusta tanto a cambios de expresi贸n facial y de iluminaci贸n, como
a alg煤n tipo de oclusi贸n, corrupci贸n u objeto de m谩scara
o disfraz