Search CORE

5 research outputs found

Online and Stochastic Gradient Methods for Non-decomposable Loss Functions

Author: Jain Prateek
Kar Purushottam
Narasimhan Harikrishna
Publication venue
Publication date: 24/10/2014
Field of study

Modern applications in sensitive domains such as biometrics and medicine frequently require the use of non-decomposable loss functions such as precision@k, F-measure etc. Compared to point loss functions such as hinge-loss, these offer much more fine grained control over prediction, but at the same time present novel challenges in terms of algorithm design and analysis. In this work we initiate a study of online learning techniques for such non-decomposable loss functions with an aim to enable incremental learning as well as design scalable solvers for batch problems. To this end, we propose an online learning framework for such loss functions. Our model enjoys several nice properties, chief amongst them being the existence of efficient online learning algorithms with sublinear regret and online to batch conversion bounds. Our model is a provable extension of existing online learning models for point loss functions. We instantiate two popular losses, prec@k and pAUC, in our model and prove sublinear regret bounds for both of them. Our proofs require a novel structural lemma over ranked lists which may be of independent interest. We then develop scalable stochastic gradient descent solvers for non-decomposable loss functions. We show that for a large family of loss functions satisfying a certain uniform convergence property (that includes prec@k, pAUC, and F-measure), our methods provably converge to the empirical risk minimizer. Such uniform convergence results were not known for these losses and we establish these using novel proof techniques. We then use extensive experimentation on real life and benchmark datasets to establish that our method can be orders of magnitude faster than a recently proposed cutting plane method.Comment: 25 pages, 3 figures, To appear in the proceedings of the 28th Annual Conference on Neural Information Processing Systems, NIPS 201

arXiv.org e-Print Archive

CiteSeerX

KDD cup 2008 and the workshop on mining medical data

Author: Balaji Krishnapuram
Good Walter F.
Oksana Yakhnenko
P. Lucas
R. Bharat Rao
Publication venue: 'Association for Computing Machinery (ACM)'
Publication date
Field of study

Crossref

Fusión de datos estadísticamente dependientes en sistemas de detección

Author: Soriano Tolosa Antonio
Publication venue: 'Universitat Politecnica de Valencia'
Publication date: 07/01/2014
Field of study

La presente tesis se centra en la problemática existente a la hora de implementar un sistema de detección o clasificación binaria cuando es necesario combinar, integrar o fusionar diversas fuentes de información que pueden ser dependientes y heterogéneas entre sí. Las técnicas de fusión de datos tratan de combinar múltiples fuentes de información para alcanzar la exactitud y precisión en la toma de decisiones que no sería posible conseguir con el uso de una sola fuente de información de forma aislada. En un sistema de detección se pueden encontrar diferentes etapas y niveles de fusión: en la etapa de pre-detección encontramos los niveles de fusión de sensores y de características, donde se combinan los diferentes flujos de muestras proporcionados por una serie de sensores o diferentes características obtenidas del procesado estos; en la etapa de post- detección, se realiza la combinación de diferentes detectores, a través de la fusión de valoraciones continuas o de decisiones individuales aportadas por cada uno de ellos. Atendiendo al tipo de datos a combinar encontramos dos grupos: fusión soft, donde se combinan datos modelados mediante variables aleatorias continuas, caracterizadas mediante sus funciones de densidad de probabilidad (PDFs), o fusión hard, asociada a la combinación de las decisiones individuales tomadas en la etapa de fusión de detectores, donde se combinan datos binarios modelados mediante variables aleatorias discretas, caracterizadas por funciones de masa de probabilidad. Se destaca la fusión de scores como un caso particular de fusión soft asociada a la fusión de diversos detectores, en donde los datos a combinar presentan buenas propiedades discriminatorias de forma aislada y se encuentran definidos en un mismo rango normalizado [0,1]. En el presente trabajo se ha realizado una completa revisión del estado del arte en cuanto a técnicas de fusión y combinación de datos aplicadas en problemas de detección donde los datos pueden ser heterogéneos y dependientes entre sí. Se realiza una revisión en mayor profundidad de la técnica de estimación de PDFs basada en la teoría de cópulas, la cual puede ser usada en la fusión óptima de datos soft. Se destaca de forma especial tanto por su novedad e incipiente uso en el campo del procesado de señal, como por su adecuación en problemas de detección, permitiéndonos modelar de forma aislada las funciones marginales de los datos y la estructura de dependencia presente entre ellos, simplificando el problema de modelado de PDFs de datos heterogéneos y dependientes. Se ha propuesto una nueva técnica de fusión soft denominada integración-a, basada en una función de media-a, la cual, sin elevar mucho la complejidad, aporta un mayor grado de flexibilidad y de adaptación, siendo capaz de mejorar las prestaciones que se pueden obtener con respecto al resto de técnicas subóptimas utilizadas comúnmente en problemas de fusión de scores heterogéneos y dependientes entre sí. Se ha derivado un novedoso método de entrenamiento basado en el criterio de maximización parcial del área bajo la curva ROC. Se han utilizado diversas bases de datos públicas para poder testear y comprobar el correcto funcionamiento de las técnicas de fusión propuestas en problemas de autentificación multibiométrica. También se han aplicado algunas de las técnicas de fusión en la mejora de un sistema de detección de eventos acústicos. Se ha propuesto un nuevo tipo de detector basado en la teoría de cópulas denominado COCD para lidiar con el problema de la detección de señal desconocida en presencia de ruido aleatorio dependiente y no Gaussiano, centrándonos en su utilización para una aplicación de detección de eventos sonoros desconocidos. También se realiza un estudio de fusión de más de un canal de audio (utilizando más de un micrófono para captar diferentes señales) como método para incrementar las prestaciones obtenidas.Soriano Tolosa, A. (2013). Fusión de datos estadísticamente dependientes en sistemas de detección [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/34780TESI

Crossref

RiuNet