L’apprentissage d’ordonnancement pour l’appariement de questions

Abstract

National audienceCet article présente une approche permettant à un utilisateur d’interroger une base de connaissances type FAQ, c’est-à-dire un ensemble de questions et leurs réponses respectives rédigées en langue naturelle. Le composant présenté dans cet article apparie la question de l’utilisateur à une ou plusieurs questions de la base de connaissances. Pour cela, nous utilisons un composant déjà existant d’analyse de questions, capable de sélectionner un ensemble de questions candidates proches de la question utilisateur, et de produire des traits propres à chaque couple (question utilisateur, question candidate). Ce composant est chaîné à un modèle permettant l’ordonnancement des questions candidates, qui est appris automatiquement de façon supervisée, une partie seulement du corpus d'apprentissage étant annotée manuellement, et le reste grâce à des règles add-hoc. Ces travaux reprennent les résultats d’un domaine de recherche récent, l’apprentissage d’ordonnancement (Learning to Rank), et les adaptent à une application industrielle innovante, l’appariement de questions comme paradigme d’accès à la connaissance. Une expérimentation évalue sur des données issues d’un système en production la qualité de chacune des phases d’apprentissage

    Similar works