unknown

Writer identification and verification in handwritten documents

Abstract

In this communication we apply an Information Retrieval model for the writer identification task. Queries are handwreitten document images projected on a suitable feature set. The handwritten document database is indexed according to the vector space model originaly used for textual information. The approach uses both the image and textual description of handwritten documents. Identified documents are then processed by the verification stage. We use a mutual information criterion so as to verify that each identified document can have been written by the writer of the query. Decision operates using an hypothesis test. The approcah is evaluated on two different database and proves to be robust to the variability of handwriting. Perspectives are oriented towards the use of large handwritten document databaseDans cette communication, nous appliquons un modèle de recherche d’information pour la tâche d’identification du scripteur. Les requêtes sont des images de documents qui sont tout d’abord projetées dans un espace de caractéristiques. La base de documents manuscrits est indexée selon le principe du modèle vectoriel de recherche d’information textuelle. L’approche exploite donc à la fois la représentation mixte image et textuelle spécifique d’un document manuscrit. Les documents identifiés à l’issue de cette étape font ensuite l’objet d’une analyse complémentaire pour vérifier les hypothèses émises. Nous proposons d’utiliser un critère d’information mutuelle pour vérifier que chacun des documents identifiés peut avoir été produit par le scripteur de la requête. Nous utilisons un test d’hypothèse à cet effet. L’approche est testée sur deux bases d’écritures différentes et montre une grande robustesse aux différentes écritures. L’approche semble donc très intéressante pour des applications à plus grande échelle nécessitant d’interroger des bases de documents manuscrits

    Similar works