unknown

Document segmentation by interest areas detection

Abstract

This paper presents a new approach of document structuring by the description of a foveated vision system implied in extracting visual and eye-catching information of a document . The simulation system is based on psycho-perceptive rules for visual data capturing. It allows us to obtain a representation of segmented document by using simple low-level processing . The low-level process is based on a visual integrative memory which displays the unequal importance of information in the visual field . The resulting segmentation enhances the fact that the access of information is directly linked to the search of attractive areas . The technical approach of the segmentation (using a space-variant geometry and a multiresolution process) lays a sound basis for elaborating the kinetic of the ocular displacement on a document. It provides not only a document representation in blocks, but shows a unified view corresponding to the integration of time-variant representations of the same visual field . The resulting blocks (text, graphs, image) are determined and localized all the better, such that the number of fixation points increases and yields a more complete and detailed description of components .Cette étude présente une nouvelle approche de la structuration de documents imprimés basée sur l'exploitation de la dynamique du regard dans le repérage de l'information. Le système qui a été mis en place nous permet d'obtenir une représentation du document segmenté en faisant appel à des procédures d'extraction de primitives géométriques simples (traitements de bas niveau) relevant de la prise en compte de certains comportements caractéristiques chez l'homme dans l'extraction d'information. Il utilise une série de représentations de type multirésolution du document où la nature du sous-échantillonnage est une fonction de la position du regard. Cette approche est basée sur la recherche des zones de focalisation de l'attention permettant de conserver une description précise des éléments dans les zones de fixation, tout en résumant les régions présentant un « intérêt » moindre. La simulation du parcours de l'oeil sur le document que nous avons retenue traduit la segmentation que ferait un lecteur qui aborde le document sans a priori sur ce qu'il veut trouver. Pour cela, nous nous sommes inspirés d'une stratégie exploratoire particulière : le survol. Celle-ci s'appuie essentiellement sur l'aspect visuel du document, c'est-à-dire sur les caractéristiques visuelles de bas niveau de l'image. Elle permet en outre une perception équilibrée des données en privilégiant l'organisation globale du document. La technique mise en oeuvre s'appuie sur un partitionnement évolutif de l'espace, en zones centrées aux points de fixation successifs. C'est sur la base de ce partitionnement, que la description des différentes régions ciblées du document évolue et converge vers une représentation segmentée

    Similar works