756 research outputs found

    Effective Geometric Restoration of Distorted Historical Document for Large-Scale Digitization

    Get PDF
    Due to storage conditions and material’s non-planar shape, geometric distortion of the 2-D content is widely present in scanned document images. Effective geometric restoration of these distorted document images considerably increases character recognition rate in large-scale digitisation. For large-scale digitisation of historical books, geometric restoration solutions expect to be accurate, generic, robust, unsupervised and reversible. However, most methods in the literature concentrate on improving restoration accuracy for specific distortion effect, but not their applicability in large-scale digitisation. This paper proposes an effective mesh based geometric restoration system, (GRLSD), for large-scale distorted historical document digitisation. In this system, an automatic mesh generation based dewarping tool is proposed to geometrically model and correct arbitrary warping historical documents. An XML based mesh recorder is proposed to record the mesh of distortion information for reversible use. A graphic user interface toolkit is designed to visually display and manually manipulate the mesh for improving geometric restoration accuracy. Experimental results show that the proposed automatic dewarping approach efficiently corrects arbitrarily warped historical documents, with an improved performance over several state-of-the-art geometric restoration methods. By using XML mesh recorder and GUI toolkit, the GRLSD system greatly aids users to flexibly monitor and correct ambiguous points of mesh for the prevention of damaging historical document images without distortions in large-scale digitalisation

    MataDoc: Margin and Text Aware Document Dewarping for Arbitrary Boundary

    Full text link
    Document dewarping from a distorted camera-captured image is of great value for OCR and document understanding. The document boundary plays an important role which is more evident than the inner region in document dewarping. Current learning-based methods mainly focus on complete boundary cases, leading to poor document correction performance of documents with incomplete boundaries. In contrast to these methods, this paper proposes MataDoc, the first method focusing on arbitrary boundary document dewarping with margin and text aware regularizations. Specifically, we design the margin regularization by explicitly considering background consistency to enhance boundary perception. Moreover, we introduce word position consistency to keep text lines straight in rectified document images. To produce a comprehensive evaluation of MataDoc, we propose a novel benchmark ArbDoc, mainly consisting of document images with arbitrary boundaries in four typical scenarios. Extensive experiments confirm the superiority of MataDoc with consideration for the incomplete boundary on ArbDoc and also demonstrate the effectiveness of the proposed method on DocUNet, DIR300, and WarpDoc datasets.Comment: 12 page

    DYNAMIC PARTICLE SYSTEMS FOR OBJECT STRUCTURE EXTRACTION

    Full text link

    Contours actifs : application à la détection de rangs de cultures en télédétection haute résolution

    Get PDF
    - La détection de rangs est une étape indispensable à l'analyse d'images de télédétection haute résolution de cultures en rangs. Nous proposons dans ce papier un algorithme qui s'appuie sur un réseau de modèles déformables. Il s'agit d'un réseau de lignes quasi-parallèles dont l'objectif est de se « caler» sur les rangs de cultures. Après une étape d'initialisation fondée sur les propriétés spectrales de l'image, la convergence du réseau est assurée par la minimisation d'un critère énergétique. La formulation du critère met en jeu une énergie interne, reflétant les contraintes géométriques du réseau, et une énergie externe, qui rend compte de l'interaction entre le réseau et l'image

    Paramètres locaux pour une méthode de contours actifs

    Get PDF
    L'introduction des contours actifs (snakes) comme nouvelle méthode d'extraction des contours dans le domaine du traitement d'images a constitué une avancée majeure en ce qui concerne les méthodes de segmentation. Malheureusement, la modélisation de la fonctionnelle d'énergie qui doit être associée à chaque image est délicate. En effet, elle dépend de nombreux paramètres qui sont souvent fixés empiriquement par le concepteur du système. Nous proposons ici une méthode originale qui permet de résoudre, dans la plupart des cas, le problème de la détermination de ces paramètres. La méthode est présentée dans le cadre de l'algorithme "greedy". Nous considérons ici que les coefficients de la fonctionnelle d'énergie ne sont pas globaux, ni indépendants des points considérés mais qu'ils sont locaux. Nous les recherchons donc en chaque point en effectuant le meilleur choix dans un ensemble de paramètres qui est crée par des tirages aléatoires. L'application sur un ensemble d'images variées, dont des radiographies, montre la convergence de la méthode proposée

    PLOT3D user's manual

    Get PDF
    PLOT3D is a computer graphics program designed to visualize the grids and solutions of computational fluid dynamics. Seventy-four functions are available. Versions are available for many systems. PLOT3D can handle multiple grids with a million or more grid points, and can produce varieties of model renderings, such as wireframe or flat shaded. Output from PLOT3D can be used in animation programs. The first part of this manual is a tutorial that takes the reader, keystroke by keystroke, through a PLOT3D session. The second part of the manual contains reference chapters, including the helpfile, data file formats, advice on changing PLOT3D, and sample command files

    Document image restoration - For document images scanned from bound volumes -

    Get PDF
    Ph.DDOCTOR OF PHILOSOPH
    corecore