756 research outputs found
Effective Geometric Restoration of Distorted Historical Document for Large-Scale Digitization
Due to storage conditions and material’s non-planar shape, geometric distortion of the 2-D content is widely present in scanned document images. Effective geometric restoration of these distorted document images considerably increases character recognition rate in large-scale digitisation. For large-scale digitisation of historical books, geometric restoration solutions expect to be accurate, generic, robust, unsupervised and reversible. However, most methods in the literature concentrate on improving restoration accuracy for specific distortion effect, but not their applicability in large-scale digitisation. This paper proposes an effective mesh based geometric restoration system, (GRLSD), for large-scale distorted historical document digitisation. In this system, an automatic mesh generation based dewarping tool is proposed to geometrically model and correct arbitrary warping historical documents. An XML based mesh recorder is proposed to record the mesh of distortion information for reversible use. A graphic user interface toolkit is designed to visually display and manually manipulate the mesh for improving geometric restoration accuracy. Experimental results show that the proposed automatic dewarping approach efficiently corrects arbitrarily warped historical documents, with an improved performance over several state-of-the-art geometric restoration methods. By using XML mesh recorder and GUI toolkit, the GRLSD system greatly aids users to flexibly monitor and correct ambiguous points of mesh for the prevention of damaging historical document images without distortions in large-scale digitalisation
MataDoc: Margin and Text Aware Document Dewarping for Arbitrary Boundary
Document dewarping from a distorted camera-captured image is of great value
for OCR and document understanding. The document boundary plays an important
role which is more evident than the inner region in document dewarping. Current
learning-based methods mainly focus on complete boundary cases, leading to poor
document correction performance of documents with incomplete boundaries. In
contrast to these methods, this paper proposes MataDoc, the first method
focusing on arbitrary boundary document dewarping with margin and text aware
regularizations. Specifically, we design the margin regularization by
explicitly considering background consistency to enhance boundary perception.
Moreover, we introduce word position consistency to keep text lines straight in
rectified document images. To produce a comprehensive evaluation of MataDoc, we
propose a novel benchmark ArbDoc, mainly consisting of document images with
arbitrary boundaries in four typical scenarios. Extensive experiments confirm
the superiority of MataDoc with consideration for the incomplete boundary on
ArbDoc and also demonstrate the effectiveness of the proposed method on
DocUNet, DIR300, and WarpDoc datasets.Comment: 12 page
Contours actifs : application à la détection de rangs de cultures en télédétection haute résolution
- La détection de rangs est une étape indispensable à l'analyse d'images de télédétection haute résolution de cultures en rangs. Nous proposons dans ce papier un algorithme qui s'appuie sur un réseau de modèles déformables. Il s'agit d'un réseau de lignes quasi-parallèles dont l'objectif est de se « caler» sur les rangs de cultures. Après une étape d'initialisation fondée sur les propriétés spectrales de l'image, la convergence du réseau est assurée par la minimisation d'un critère énergétique. La formulation du critère met en jeu une énergie interne, reflétant les contraintes géométriques du réseau, et une énergie externe, qui rend compte de l'interaction entre le réseau et l'image
Paramètres locaux pour une méthode de contours actifs
L'introduction des contours actifs (snakes) comme nouvelle méthode d'extraction des contours dans le domaine du traitement d'images a constitué une avancée majeure en ce qui concerne les méthodes de segmentation. Malheureusement, la modélisation de la fonctionnelle d'énergie qui doit être associée à chaque image est délicate. En effet, elle dépend de nombreux paramètres qui sont souvent fixés empiriquement par le concepteur du système. Nous proposons ici une méthode originale qui permet de résoudre, dans la plupart des cas, le problème de la détermination de ces paramètres. La méthode est présentée dans le cadre de l'algorithme "greedy". Nous considérons ici que les coefficients de la fonctionnelle d'énergie ne sont pas globaux, ni indépendants des points considérés mais qu'ils sont locaux. Nous les recherchons donc en chaque point en effectuant le meilleur choix dans un ensemble de paramètres qui est crée par des tirages aléatoires. L'application sur un ensemble d'images variées, dont des radiographies, montre la convergence de la méthode proposée
PLOT3D user's manual
PLOT3D is a computer graphics program designed to visualize the grids and solutions of computational fluid dynamics. Seventy-four functions are available. Versions are available for many systems. PLOT3D can handle multiple grids with a million or more grid points, and can produce varieties of model renderings, such as wireframe or flat shaded. Output from PLOT3D can be used in animation programs. The first part of this manual is a tutorial that takes the reader, keystroke by keystroke, through a PLOT3D session. The second part of the manual contains reference chapters, including the helpfile, data file formats, advice on changing PLOT3D, and sample command files
Document image restoration - For document images scanned from bound volumes -
Ph.DDOCTOR OF PHILOSOPH
- …