4 research outputs found
Contribution à la reconnaissance des structures des documents écrits (approche probabiliste)
Cette thèse porte sur la rétroconversion de documents dits à "typographie riche et récurrent" en se basant sur des marquages typographiques à extraire dans les images de ces documents. Notre objectif était de concevoir un système de reconnaissance de structures qui soit capable de s'adapter aux difficultés dues à la complexité et la variabilité de ces documents. Nous avons développé une approche hybride (structurelle et probabiliste) combinant un réseau bayésien classifieur et un automate probabiliste intégrés dans une représentation arborescente hiérarchique de la structure logique. Nous avons procédé par apprentissage supervisé, et dans ce cadre, nous avons utilisé la programmation génétique. Nous avons expérimenté notre approche sur des sommaires de revues et de périodiques et les résultats obtenus peuvent être qualifiés de satisfaisants. Cette expérimentation a permis de confirmer les potentiels d'interactivité entre les différentes composantes du système de reconnaissance proposé.This thesis turns on reserve-engineering of documents "recurrent and rich in typography" which is based on typographical tags to be identified directly from document images. Our purpose is to conceive a recognition system for logical structures that has to fit the problems brought by these documents complexity and variability. An original hybrid (structural and probabilistic) approach is proposed which combines a bayesian network classifier and a probabilistic automata that are integrated into a tree hierarchical representation of logical structure. For each part of the model, we used supervised learning that includes a new method using genetic programming for bayesian networks learning. This approach has been applied to tables of contents in periodical documents and has provided interesting results that open up different perspectives and especially for developing the interactivity aspect between the recognition system components.VILLEURBANNE-DOC'INSA LYON (692662301) / SudocSudocFranceF
Une approche probabiliste pour la reconnaissance des sommaires
National audienceDocument Analysis and Recognition consist in translating their images into an electronic form that can be reusable. The analysis extracts the document layout structure from its image, and the recognition assigns to the layout structure components their logical functions in the document. In this article, we present our work on recognition of a category of documents in which the logical structure is based on typographical tagging such as table of contents. We propose a perceptual approach that extracts these typographical tagging directly from document images. However, the structures of such documents are complex and variable. Their complexity can cause errors in the analysis output, which influence directly the recognition task, while their variability requires defining a generic form of logical structures and the related recognition tasks. Our goal is to consider the document structure recognition problem even though these difficulties occur. We developed a automatic recognition system based on a hybrid model combining a bayesian classifier and a probabilistic automaton. The classifier is responsible of drawing a correspondence between text blocks extracted from document images and basic logical entities, while the automaton deals with grouping these entities into a hierarchical logical structure. This hybrid model is built by semi-supervised learning based on knowledge provided by the user on the one hand, and the typographical properties of our documents, on the other hand. This system has been experimented for automatic indexing of tables of contents in periodicals and journals. The complexity and the variability of these documents allow us to show the efficiency of the approach.L'analyse et la reconnaissance des documents écrits consistent à traduire leurs images numérisées sous une forme électronique réutilisable. L'analyse permet d'extraire à partir de l'image d'un document une structure dite physique, tandis que la reconnaissance associe aux composants de la structure physique leurs fonctions logiques dans le document. Le travail présenté dans cet article porte sur la phase de reconnaissance de documents dont la structuration logique est caractérisée par des marquages typographiques tels que les sommaires ou les tables des matières. Nous proposons une approche perceptuelle qui se base sur l'extraction de ces marquages typographiques directement à partir des images des documents. Ces documents présentent cependant une structuration variable et complexe. La complexité pose des difficultés au niveau de la phase d'analyse et peut conduire à des erreurs dans les données présentées à la phase de reconnaissance. Quant à la variabilité, elle impose d'entreprendre une modélisation générique de la structure logique et du processus de reconnaissance associé. Notre objectif est d'aborder ce problème de reconnaissance en présence de ces difficultés. Nous avons développé un système de reconnaissance automatique basé sur un modèle hybride combinant un classifieur bayésien et un automate probabiliste. Le rôle du classifieur est la correspondance entre les blocs de texte extraits dans les images des documents et les entités logiques à un niveau de structuration de base, alors que l'automate permet de regrouper ces entités logiques sur plusieurs niveaux hiérarchiques reconstruisant ainsi toute la structure logique. Ce modèle hybride est construit par apprentissage semi-supervisé, en s'appuyant d'une part sur la connaissance fournie de manière interactive par l'utilisateur, et d'autre part sur les propriétés typographiques des documents considérés. Nous avons expérimenté le système proposé pour l'indexation de sommaires de revues. La complexité et la variabilité de la structuration de ces documents nous ont permis de montrer l'efficacité de l'approche développée
Web Intelligence: Web-Based BISC Decision Support System (WBISC-DSS)
Abstract: Most of the existing search systems (software) are modeled using crisp logic and queries. In this chapter, we introduce fuzzy querying and ranking as a flexible tool allowing approximation where the selected objects do not need to exactly match the decision criteria resembling natural human behavior. The model consists of five major modules: the Fuzzy Search Engine, Application Templates, the User Interface, the Database, and Evolutionary Computing. The system is designed in a generic form to accommodate more diverse applications and to be delivered as stand-alone software to academia and bus inesses.
Bayesian networks classifiers applied to documents
This paper discusses the use of the bayesian network model for a classification problem related to the document image understanding field. Our application is focused on logical labeling in documents, which consists in assigning logical labels to text blocks. The objective is to map a set of logical tags, composing the document logical structure, to the physical text components. We build a bayesian network model that allows this mapping using supervised learning, and without imposing a priori constraints on the document structure. The learning strategy is based partly on genetic programming tools. A prototype has been implemented, and tested on tables of contents found in periodicals and magazines.