41 research outputs found

    Évaluation de la pertinence dans les moteurs de recherche géoréférencés

    Get PDF
    National audienceLearning to rank documents on a search engine requires relevance judgments. We introduce the results of an innovating study on relevance modeling for local search engines. These search engines present search results on a map or as a list of maps. Each map contains all the attributes of a place (noun, address, phone number, etc). Most of these attributes are links users can click. We model the relevance as the weighted sum of all the clicks on a result. We obtain good results by fixing the same weight for each component of the model. We propose a relative order between clicks to determine the optimal weights.Optimiser le classement des résultats d’un moteur par un algorithme de learning to rank nécessite de connaître des jugements de pertinence entre requêtes et documents. Nous présentons les résultats d’une étude pilote sur la modélisation de la pertinence dans les moteurs de recherche géoréférencés. La particularité de ces moteurs est de présenter les résultats de recherche sous forme de carte géographique ou de liste de fiches. Ces fiches contiennent les caractéristiques du lieu (nom, adresse, téléphone, etc.) dont la plupart sont cliquables par l’utilisateur. Nous modélisons la pertinence comme la somme pondérée des clics sur le résultat. Nous montrons qu’équipondérer les différents éléments du modèle donne de bons résultats et qu’un ordre d’importance entre type de clics peut être déduit pour déterminer les pondérations optimales

    La sélection de variables en apprentissage d'ordonnancement pour la recherche d'information : vers une approche contextuelle

    Get PDF
    L'apprentissage d'ordonnancement, ou learning-to-rank, consiste à optimiser automatiquement une fonction d'ordonnancement apprise à l'aide d'un algorithme à partir de données d'apprentissage. Les approches existantes présentent deux limites. D'une part, le nombre de caractéristiques utilisées est généralement élevé, de quelques centaines à plusieurs milliers, ce qui pose des problèmes de qualité et de volumétrie. D'autre part, une seule fonction est apprise pour l'ensemble des requêtes. Ainsi, l'apprentissage d'ordonnancement ne prend pas en compte le type de besoin ou le contexte de la recherche. Nos travaux portent sur l'utilisation de la sélection de variables en apprentissage d'ordonnancement pour résoudre à la fois les problèmes de la volumétrie et de l'adaptation au contexte. Nous proposons cinq algorithmes de sélection de variables basés sur les Séparateurs à Vaste Marge (SVM) parcimonieux. Trois sont des approches de repondération de la norme L2, une résout un problème d'optimisation en norme L1 et la dernière considère des régularisations non convexes. Nos approches donnent de meilleurs résultats que l'état de l'art sur les jeux de données de référence. Elles sont plus parcimonieuses et plus rapides tout en permettant d'obtenir des performances identiques en matière de RI. Nous évaluons également nos approches sur un jeu de données issu du moteur commercial Nomao. Les résultats confirment la performance de nos algorithmes. Nous proposons dans ce cadre une méthodologie d'évaluation de la pertinence à partir des clics des utilisateurs pour le cas non étudié dans la littérature des documents multi-cliquables (cartes). Enfin, nous proposons un système d'ordonnancement adaptatif dépendant des requêtes basé sur la sélection de variables. Ce système apprend des fonctions d'ordonnancement spécifiques à un contexte donné, en considérant des groupes de requêtes et les caractéristiques obtenues par sélection pour chacun d'eux.Learning-to-rank aims at automatically optimizing a ranking function learned on training data by a machine learning algorithm. Existing approaches have two major drawbacks. Firstly, the ranking functions can use several thousands of features, which is an issue since algorithms have to deal with large scale data. This can also have a negative impact on the ranking quality. Secondly, algorithms learn an unique fonction for all queries. Then, nor the kind of user need neither the context of the query are taken into account in the ranking process. Our works focus on solving the large-scale issue and the context-aware issue by using feature selection methods dedicated to learning-to-rank. We propose five feature selection algorithms based on sparse Support Vector Machines (SVM). Three proceed to feature selection by reweighting the L2-norm, one solves a L1-regularized problem whereas the last algorithm consider nonconvex regularizations. Our methods are faster and sparser than state-of-the-art algorithms on benchmark datasets, while providing similar performances in terms of RI measures. We also evaluate our approches on a commercial dataset. Experimentations confirm the previous results. We propose in this context a relevance model based on users clicks, in the special case of multi-clickable documents. Finally, we propose an adaptative and query-dependent ranking system based on feature selection. This system considers several clusters of queries, each group defines a context. For each cluster, the system selects a group of features to learn a context-aware ranking function

    Diversité et système de recommandation : application à une plateforme de blogs à fort trafic (convention CIFRE n°20091274)

    Get PDF
    Les systèmes de recommandation ont pour objectif de proposer automatique­ment aux usagers des objets en relation avec leurs intérêts. Ces outils d'aide à l'accès à l'information sont de plus en plus présents sur les plateformes de conte­nus. Dans ce contexte, les intérêts des usagers peuvent être modélisés à partir du contenu des documents visités ou des actions réalisées (clics, commentaires, ...). Cependant, ces intérêts ne peuvent être modélisés en cas de démarrage à froid, c'est-à-dire pour un usager inconnu du système ou un nouveau document. Cette modélisation s'avère donc complexe à obtenir, et demeure parfois incom­plète, conduisant à des recommandations bien souvent éloignées des intérêts réels des usagers. De plus, les approches existantes ne sont généralement pas en me­sure de garantir des performances satisfaisantes sur des plateformes à fort trafic et hébergeant une volumétrie de données conséquente. Pour tendre vers des recommandations plus pertinentes, nous proposons un modèle de système de recommandation qui construit une liste de recommandations répondant à un large spectre d'intérêts potentiels, et ce même dans un contexte où le système ne possède que peu d'informations sur l'usager. L'originalité de notre modèle est qu'il repose sur la notion de diversité. Cette diversité est obtenue en agrégeant le résultat de différentes mesures de sélection pour construire la liste de recommandations finale. Après avoir démontré l'intérêt de notre approche en utilisant des corpus des références, ainsi qu'au travers d'une évaluation auprès d'usagers réels, nous évaluons notre modèle sur la plateforme de blogs OverBlog. Nous validons ainsi notre proposition dans un contexte industriel à grande échelle.Recommender Systems aim at automatically providing objects related to user's interests. These tools are increasingly used on content platforms to help the users to access information. In this context, user's interests can be modeled from the visited content and/or user's actions (clicks, comments, etc). However, these interests can not be modeled for an unknown user (cold start issue). Therefore, modeling is complex and recommendations are often far away from the real user's interests. In addition, existing approaches are generally not able to guarantee good performances on platforms with high trafic and which host a significant volume of data. To obtain more relevant recommendations for each user, we propose a recommender system model that builds a list of recommendations aiming at covering a large range of interests, even when only few information about the user is available. The recommender system model we propose is based on diversity. It uses different interest measures and an aggregation function to build the final set of recommendations. We demonstrate the interest of our approach using reference collections and through a user study. Finally, we evaluate our model on the OverBlog platform to validate its scalability in an industrial context

    Diversité et système de recommandation : application à une plateforme de blogs à fort trafic

    Get PDF
    Recommender Systems aim at automatically providing objects related to user’s interests. These tools are increasingly used on content platforms to help the users to access information. In this context, user’s interests can be modeled from the visited content and/or user’s actions (clicks, comments, etc). However, these interests can not be modeled for an unknown user (cold start issue). Therefore, modeling is complex and recommendations are often far away from the real user’s interests. In addition, existing approaches are generally not able to guarantee good performances on platforms with high traffic and which host a significant volume of data.To obtain more relevant recommendations for each user, we propose a recommender system model that builds a list of recommendations aiming at covering a large range of interests, even when only few information about the user is available. The recommender system model we propose is based on diversity. It uses different interest measures and an aggregation function to build the final set of recommendations.We demonstrate the interest of our approach using reference collections and through a user study. Finally, we evaluate our model on the OverBlog platform to validate its scalability in an industrial context.Les systèmes de recommandation ont pour objectif de proposer automatiquement aux usagers des objets en relation avec leurs intérêts. Ces outils d’aide à l’accès à l’information sont de plus en plus présents sur les plateformes de contenus. Dans ce contexte, les intérêts des usagers peuvent être modélisés à partir du contenu des documents visités ou des actions réalisées (clics, commentaires, ...). Cependant, ces intérêts ne peuvent être modélisés en cas de démarrage à froid, c’est-à-dire pour un usager inconnu du système ou un nouveau document. Cette modélisation s’avère donc complexe à obtenir, et demeure parfois incomplète, conduisant à des recommandations bien souvent éloignées des intérêts réels des usagers. De plus, les approches existantes ne sont généralement pas en mesure de garantir des performances satisfaisantes sur des plateformes à fort trafic et hébergeant une volumétrie de données conséquente.Pour tendre vers des recommandations plus pertinentes, nous proposons un modèle de système de recommandation qui construit une liste de recommandations répondant à un large spectre d’intérêts potentiels, et ce même dans un contexte où le système ne possède que peu d’informations sur l’usager. L’originalité de notre modèle est qu’il repose sur la notion de diversité. Cette diversité est obtenue en agrégeant le résultat de différentes mesures de sélection pour construire la liste de recommandations finale.Après avoir démontré l’intérêt de notre approche en utilisant des corpus des références, ainsi qu’au travers d’une évaluation auprès d’usagers réels, nous évaluons notre modèle sur la plateforme de blogs OverBlog. Nous validons ainsi notre proposition dans un contexte industriel à grande échelle

    MobiSim. Appropriation et développement par ThéMA : vers une modélisation multiscalaire (fractale) du développement urbain par système multi-agents

    No full text
    63Le projet MobiSim (simulation des mobilités) consiste à développer une plateforme de simulation pour l'étude prospective des mobilités quotidiennes et résidentielles dans les agglomérations françaises et européennes, et leur lien avec le développement, l'étalement et l'aménagement urbains. Cette plateforme se base sur plusieurs modèles, notamment un Système multi-agents, couplé à un Automate cellulaire. Les différents champs de développements identifiés aujourd'hui concernent les problématiques de la gestion du trafic et des déplacements, des nuisances et des pollutions engendrées, de la consommation énergétique urbaine, des stratégies des acteurs et des choix modaux de déplacements, etc. L'objet de la recherche, dont ce rapport fait état, n'était pas de proposer des développements spécifiques pour la plateforme de simulation MobiSim, mais essentiellement de réaliser le transfert du programme de ATN vers ThéMA, suite à la cessation d'activité de l'entreprise ATN en 2008. Cette appropriation a nécessité une expertise logicielle importante. Sur la base des codes sources fournis, elle a donné lieu à une réécriture quasiment intégrale du programme. Cette réécriture propose dorénavant une nouvelle base théorique et informatique pour MobiSim, qui permet d'envisager concrètement et rapidement l'implémentation de modules complémentaires au sein du programme. L'approche individus-centrée, envisagée à l'échelle d'une aire urbaine, même de taille moyenne ou modeste, entraîne nécessairement la simulation des choix de mobilité de plusieurs dizaines de milliers d'agents, et un temps de calcul souvent exponentiel. Elle permet toutefois de positionner le projet MobiSim sur deux versants complémentaires : - d'une part, il s'agit d'utiliser la plateforme comme un outil de réflexion théorique permettant de poser un certain nombre d'hypothèses sur les liens existant entre les mobilités, la morphogénèse urbaine (étalement urbain, hiérarchie d'échelle, fractalité) et la consommation d'énergie associée, et d'y répondre par l'intermédiaire de tests de scénarios. MobiSim doit aussi permettre d'identifier les leviers qui peuvent influencer les politiques urbaines, notamment en matière de transport et de planification, et de qualifier les interactions possibles entre ces différentes politiques ; - d'autre part, il s'agit également de continuer à utiliser MobiSim comme une plateforme appliquée, i.e. un outil d'aide à la décision " au contact " des problématiques locales, permettant de tester des scénarios d'aménagement du territoire. Sur le plan des résultats escomptés et en cours de développement, MobiSim doit permettre (et permet déjà en partie) d'évaluer les conséquences associées à chaque scénario de mobilité sur chacune des trois sphères généralement associées au développement durable

    Outil innovant pour la gestion des routes

    Get PDF
    Ce mémoire consiste à proposer un outil graphique dans les systèmes de la gestion modern des chaussées afin d’aider les décisionnaires dans l’élaboration d’une meilleure stratégie d’entretien et de réhabilitation au moment opportun dont les caractéristiques seront : des décisions fiables et efficaces qui permettent de répondre au problème au moindre coût. Les systèmes de gestion de chaussées reposent sur la collecte de données, prérequis essential pour la détermination des causes de détérioration et pour l'analyse des performances des chaussées. Cette approche tient une place importante dans ce mémoire puisque l’objectif est de développer un outil graphique d’optimisation pour une prise de décisions rationnelle, c'est-à-dire basée sur des données objectives et stratégiques, car elle repose sur une approche de compilation de toutes les données. L’outil proposé s’appuie sur la cueillette et l’analyse des données suivant un plan de qualité exposé, ainsi que la visualisation graphique de ces données sur la plateforme Google Earth, ceci permet d’intégrer, de visualiser et de stocker une abondante quantité d’informations pour différents niveaux de décisions. L’outil utilise du matériel technologique très répandu et peu coûteux dont des caméras video géoréférencées pour la cueillette des données, des applications téléphoniques pour relever la géométrie en x, y et z des routes étudiées, puis le dispositif OBD (On-Board Diagnostic) employé dans le calcul des émissions polluantes, et finalement l’ordinateur outil de traitement et d’analyse. Cet outil graphique a été appliqué et a permis de valider l’approche en études de réhabilitation de routes urbaines et rurales. L’adoption de l’outil graphique contribuera à l’amélioration et l’optimisation de la qualité du processus de prise de décisions

    Carbone des sols en Afrique

    Get PDF
    Les sols sont une ressource essentielle à préserver pour la production d’aliments, de fibres, de biomasse, pour la filtration de l’eau, la préservation de la biodiversité et le stockage du carbone. En tant que réservoirs de carbone, les sols sont par ailleurs appelés à jouer un rôle primordial dans la lutte contre l’augmentation de la concentration de gaz à effet de serre. Ils sont ainsi au centre des objectifs de développement durable (ODD) des Nations unies, notamment les ODD 2 « Faim zéro », 13 « Lutte contre le changement climatique », 15 « Vie terrestre », 12 « Consommation et production responsables » ou encore 1 « Pas de pauvreté ». Cet ouvrage présente un état des lieux des sols africains dans toute leur diversité, mais au-delà, il documente les capacités de stockage de carbone selon les types de sols et leurs usages en Afrique. Il propose également des recommandations autour de l’acquisition et de l’interprétation des données, ainsi que des options pour préserver, voire augmenter les stocks de carbone dans les sols. Tous les chercheurs et acteurs du développement impliqués dans les recherches sur le rôle du carbone des sols sont concernés par cette synthèse collective. Fruit d’une collaboration entre chercheurs africains et européens, ce livre insiste sur la nécessité de prendre en compte la grande variété des contextes agricoles et forestiers africains pour améliorer nos connaissances sur les capacités de stockage de carbone des sols et lutter contre le changement climatique
    corecore