research

Les propriétés grammaticales du genre de l'offre d'emploi aux fondements d'une méthode de classement automatique.

Abstract

Nous présentons un projet de fouille de textes qui vise à développer une méthode de classement automatique d'offres d'emploi et d'identification des impératifs de compétences ; la méthode s'appuie sur l'étude des termes au sein de constructions grammaticales prototypiques (Bourrigault et Jacquemin, 2000 ; Tutin, 2007) permettant de saisir la sémantique lexicale et ce d'autant mieux au sein de l'horizon interprétatif défini par un genre spécifique (Condamines, 2006). Notre corpus se compose de 13375 offres d'emploi couvrant l'ensemble des métiers et secteurs, et annotées automatiquement en dépendances suivant une technique décrite dans (De La Clergerie et al., 2009 ; Erk & Padó, 2008 ; Padó & Lapata, 2007). Les patrons relevés, qui associent un jargon des ressources humaines et un lexique spécifique au métier concerné, permettent de distinguer les " compétences " d'autres classes de locutions emblématiques (par ex. l'intitulé du poste etc.) (Loth, 2010), ainsi que de classer les compétences (savoir-faire, personnalité, formation etc.). L'étude questionne ainsi la caractérisation multi-dimensionnelle des genres (Biber, 1988, 1993 ; Malrieu & Rastier, 2001 ; Rastier, 2001) et les liens entre syntaxe et sémantique (paradigmes constructionnels typiques et sémantique résultante)

    Similar works