Visualisation de données dans le domaine de l’E-recrutement

Abstract

La récente profusion des données, communément appelée Big Data, nécessite une analyse pertinente de ces larges volumes de données afin d’en tirer l’information utile nécessaire à la prise de décision. La visualisation de données se révèle à cet égard un moyen efficace pour transmettre cette information de façon interactive et synthétique. Le travail décrit dans ce mémoire qui constitue un volet du projet BPP, collaboration entre le RALI et la société LittleBigJob (LBJ), vise à répondre à ce besoin par l’implémentation d’un tableau de bord permettant la visualisation des offres d’emploi sur le web. Ces offres étant composées de plusieurs sections : titre de l’offre, compagnie qui recrute, description de l’offre, etc. Certaines informations contenues dans la description de l’offre ne peuvent pas être extraites directement. Ainsi, pour l’extraction des compétences citées dans une offre, nous utilisons les techniques de l’apprentissage automatique et plus particulièrement les champs markoviens conditionnels (CRF) utilisés pour l’étiquetage des séquences. Les expériences menées visent également à tester la capacité de ces modèles à trouver ces compétences dans la description de l’offre avec un ensemble d’entraînement partiellement étiqueté, d’une part parce que nous ne disposons pas d’une liste complète de compétences nécessaire à l’étiquetage, et d’autre part, parce que de nouvelles compétences apparaissent continuellement.The large amount of data available nowadays, so-called Big Data, requires a relevant analysis to derive information and get insights for decision making. Data visualization is an effective way to convey this information interactively and synthetically. This work, which is part of BPP Project, a collaboration between the RALI and LBJ, aims to meet this need by implementing a dashboard for visualization of job offers on the web. These offers consist of several sections: title, company, description, etc. Some information contained in the description cannot be extracted directly. Thus, for the extraction of skills from the description of an offer, we use machine learning techniques, especially Conditional Random Fields (CRF) used for sequence labeling. We also tested the ability of those models to find skills in the description of the offer with partial labeled training dataset, as we do not have a complete list of skills required for labeling, and also because new skills appear constantly

Similar works

This paper was published in Dépôt Institutionnel Numérique.

To submit an update or takedown request for this paper, please submit an Update/Correction/Removal Request.