research

Séparateurs à Vaste Marge pondérés en norme l2 pour la sélection de variables en apprentissage d’ordonnancement

Abstract

National audienceLearning to rank algorithms are dealing with a very large amount of features to automatically learn ranking functions, which leads to an increase of both the computational cost and the number of noisy redundant features. Feature selection is seen as a promising way to address these issues. In this paper, we propose new feature selection algorithms for learning to rank based on reweighted l2 SVM approaches. We investigate a l2-AROM algorithm to solve the l0 norm optimization problem and a generic l2-reweighted algorithm to approximate l0 et l1 norm SVM problems with l2 norm SVM. Experiments show that our algorithms are up to 10 times faster and use up to 7 times less features than state-of-the-art methods, without lowering the ranking performance.Les algorithmes d’apprentissage d’ordonnancement utilisent un très grand nombre de caractéristiques pour apprendre les fonctions d’ordonnancement, entraînant une augmentation des temps d’exécution et du nombre de caractéristiques redondantes ou bruitées. La sélection de variables est une méthode prometteuse pour résoudre ces enjeux. Dans cet article, nous pro- posons de nouvelles méthodes de sélection de variables en apprentissage d’ordonnancement basées sur des approches de pondération des SVM en norme l2. Nous proposons une adap- tation d’une méthode l2-AROM pour la résolution des SVM en norme l0 et un algorithme générique de pondération de la norme l2 qui résout les problèmes en norme l0 et l1. Nos ex- périmentations montrent que les méthodes proposées sont jusqu’à 7 fois plus rapides et 10 fois plus parcimonieuses que l’état de l’art, pour des qualités d’ordonnancement équivalentes

    Similar works