5 research outputs found
Online and Stochastic Gradient Methods for Non-decomposable Loss Functions
Modern applications in sensitive domains such as biometrics and medicine
frequently require the use of non-decomposable loss functions such as
precision@k, F-measure etc. Compared to point loss functions such as
hinge-loss, these offer much more fine grained control over prediction, but at
the same time present novel challenges in terms of algorithm design and
analysis. In this work we initiate a study of online learning techniques for
such non-decomposable loss functions with an aim to enable incremental learning
as well as design scalable solvers for batch problems. To this end, we propose
an online learning framework for such loss functions. Our model enjoys several
nice properties, chief amongst them being the existence of efficient online
learning algorithms with sublinear regret and online to batch conversion
bounds. Our model is a provable extension of existing online learning models
for point loss functions. We instantiate two popular losses, prec@k and pAUC,
in our model and prove sublinear regret bounds for both of them. Our proofs
require a novel structural lemma over ranked lists which may be of independent
interest. We then develop scalable stochastic gradient descent solvers for
non-decomposable loss functions. We show that for a large family of loss
functions satisfying a certain uniform convergence property (that includes
prec@k, pAUC, and F-measure), our methods provably converge to the empirical
risk minimizer. Such uniform convergence results were not known for these
losses and we establish these using novel proof techniques. We then use
extensive experimentation on real life and benchmark datasets to establish that
our method can be orders of magnitude faster than a recently proposed cutting
plane method.Comment: 25 pages, 3 figures, To appear in the proceedings of the 28th Annual
Conference on Neural Information Processing Systems, NIPS 201
Fusi贸n de datos estad铆sticamente dependientes en sistemas de detecci贸n
La presente tesis se centra en la problem谩tica existente a la hora de implementar un
sistema de detecci贸n o clasificaci贸n binaria cuando es necesario combinar, integrar o fusionar
diversas fuentes de informaci贸n que pueden ser dependientes y heterog茅neas entre s铆. Las
t茅cnicas de fusi贸n de datos tratan de combinar m煤ltiples fuentes de informaci贸n para alcanzar
la exactitud y precisi贸n en la toma de decisiones que no ser铆a posible conseguir con el uso de
una sola fuente de informaci贸n de forma aislada.
En un sistema de detecci贸n se pueden encontrar diferentes etapas y niveles de fusi贸n: en la
etapa de pre-detecci贸n encontramos los niveles de fusi贸n de sensores y de caracter铆sticas,
donde se combinan los diferentes flujos de muestras proporcionados por una serie de
sensores o diferentes caracter铆sticas obtenidas del procesado estos; en la etapa de post-
detecci贸n, se realiza la combinaci贸n de diferentes detectores, a trav茅s de la fusi贸n de
valoraciones continuas o de decisiones individuales aportadas por cada uno de ellos.
Atendiendo al tipo de datos a combinar encontramos dos grupos: fusi贸n soft, donde se
combinan datos modelados mediante variables aleatorias continuas, caracterizadas mediante
sus funciones de densidad de probabilidad (PDFs), o fusi贸n hard, asociada a la combinaci贸n de
las decisiones individuales tomadas en la etapa de fusi贸n de detectores, donde se combinan
datos binarios modelados mediante variables aleatorias discretas, caracterizadas por funciones
de masa de probabilidad. Se destaca la fusi贸n de scores como un caso particular de fusi贸n soft
asociada a la fusi贸n de diversos detectores, en donde los datos a combinar presentan buenas
propiedades discriminatorias de forma aislada y se encuentran definidos en un mismo rango
normalizado [0,1].
En el presente trabajo se ha realizado una completa revisi贸n del estado del arte en cuanto a
t茅cnicas de fusi贸n y combinaci贸n de datos aplicadas en problemas de detecci贸n donde los
datos pueden ser heterog茅neos y dependientes entre s铆. Se realiza una revisi贸n en mayor
profundidad de la t茅cnica de estimaci贸n de PDFs basada en la teor铆a de c贸pulas, la cual puede
ser usada en la fusi贸n 贸ptima de datos soft. Se destaca de forma especial tanto por su novedad
e incipiente uso en el campo del procesado de se帽al, como por su adecuaci贸n en problemas de
detecci贸n, permiti茅ndonos modelar de forma aislada las funciones marginales de los datos y la
estructura de dependencia presente entre ellos, simplificando el problema de modelado de
PDFs de datos heterog茅neos y dependientes.
Se ha propuesto una nueva t茅cnica de fusi贸n soft denominada integraci贸n-a, basada en
una funci贸n de media-a, la cual, sin elevar mucho la complejidad, aporta un mayor grado de
flexibilidad y de adaptaci贸n, siendo capaz de mejorar las prestaciones que se pueden obtener
con respecto al resto de t茅cnicas sub贸ptimas utilizadas com煤nmente en problemas de fusi贸n
de scores heterog茅neos y dependientes entre s铆. Se ha derivado un novedoso m茅todo de
entrenamiento basado en el criterio de maximizaci贸n parcial del 谩rea bajo la curva ROC.
Se han utilizado diversas bases de datos p煤blicas para poder testear y comprobar el
correcto funcionamiento de las t茅cnicas de fusi贸n propuestas en problemas de autentificaci贸n
multibiom茅trica. Tambi茅n se han aplicado algunas de las t茅cnicas de fusi贸n en la mejora de un
sistema de detecci贸n de eventos ac煤sticos. Se ha propuesto un nuevo tipo de detector basado
en la teor铆a de c贸pulas denominado COCD para lidiar con el problema de la detecci贸n de se帽al
desconocida en presencia de ruido aleatorio dependiente y no Gaussiano, centr谩ndonos en su
utilizaci贸n para una aplicaci贸n de detecci贸n de eventos sonoros desconocidos. Tambi茅n se
realiza un estudio de fusi贸n de m谩s de un canal de audio (utilizando m谩s de un micr贸fono
para captar diferentes se帽ales) como m茅todo para incrementar las prestaciones obtenidas.Soriano Tolosa, A. (2013). Fusi贸n de datos estad铆sticamente dependientes en sistemas de detecci贸n [Tesis doctoral no publicada]. Universitat Polit猫cnica de Val猫ncia. https://doi.org/10.4995/Thesis/10251/34780TESI