2 research outputs found
Old document image analysis : a texture approach
In this article, we propose a method of characterization of images of old documents based on a texture approach. This
characterization is carried out with the help of a multi-resolution study of the textures contained in the images of the
document. Thus, by extracting five features linked to the frequencies and to the orientations in the different areas of a
page, it is possible to extract and compare elements of high semantic level without expressing any hypothesis about the
physical or logical structure of the analysed documents. Experimentations demonstrate the performance of our
propositions and the advances that they represent in terms of characterization of content of a deeply heterogeneous
corpus.Dans cet article, nous proposons une méthode de caractérisation d’images d’ouvrages anciens basée sur une
approche texture. Cette caractérisation est réalisée à l’aide d’une étude multirésolution des textures
contenues dans les images de documents. Ainsi, en extrayant cinq indices liés aux fréquences et aux
orientations dans les différentes parties d’une page, il est possible d’extraire et de comparer des éléments de
haut niveau sémantique sans émettre d’hypothèses sur la structure physique ou logique des documents
analysés. Des expérimentations montrent la faisabilité de la réalisation d’outils d’aide à la navigation ou d’aide
à l’indexation. Au travers de ces expérimentations, nous mettrons en avant la pertinence de ces indices et les
avancées qu’ils représentent en terme de caractérisation de contenu d’un corpus fortement hétérogène