Adaptation du modèle de langue pour le tri des réponses dans les BD

Abstract

International audienceL'information sur le web est de plus en plus extraite depuis des bases de données (BD) où les langages d'interrogation sont basés sur une recherche exacte. L'utilisateur se trouve confronté au problème de réponses nombreuses lorsque sa requête est peu sélective. Pour remédier à ce problème, plusieurs approches ont été proposées, à l'instar de celles utilisant les techniques de relaxation des requêtes. D'autres travaux proposent de classifier les résultats. Une autre classe d'approches, au quelle on s'intéresse, suggère l'adaptation des techniques de la recherche d'information (RI) pour trier les résultats dans les BD. On propose dans cet article, une adaptation du modèle de langue de la RI pour trier les tuples retournés selon leur score de pertinence vis-à-vis la requête. Ce score est évalué par un modèle de langue bi-gramme qui combine, à travers un lissage par interpolation, les probabilités d'occurrence des valeurs des attributs dans l'ensemble des tuples retournés ainsi que dans la BD. Nous avons évalué l'efficacité de notre approche sur une table contenant 16842 tuples. Les résultats préliminaires obtenus montrent l'intérêt d'exploiter les dépendances entre les valeurs d'attributs

    Similar works