7 research outputs found

    Retrieval of Visually Similar Images for Handwritten Documents Through Agglomerative Hierarchical Clustering

    Get PDF
    In tasks of handwritten words recognition from a collection of manuscripts, a possible approach consists on grouping images using a measure of similarity in order to get a cluster distribution, aiming to have all the same words in the same cluster. Keeping in mind this idea, agglomerative hierarchical clustering (AHC) techniques are used to implement retrieval by example methods by reducing the bag of word images in a few cluster representatives. Various linkage criteria, different distance metrics and representative obtainment methods are evaluated. A simple dataset is used to create and validate the algorithm and a subset of word images collection is used to get the final results. Modeling with the manuscript image words shows that AHC considerably reduces the amount of operation (decrease of request time) in offline handwriting recognition, giving the same (and even better) results than tradition approaches.En les tasques de reconeixement de paraules escrites a m脿 a partir d'una col路lecci贸 de manuscrits, un possible enfocament consisteix en l'agrupaci贸 d'imatges utilitzant una mesura de similitud amb la finalitat d'obtenir una distribuci贸 de cl煤ster, amb l'objectiu de tenir tots les mateixes paraules en el mateix cl煤ster. Tenint en compte aquesta idea, les t猫cniques de clustering aglomeratiu jer脿rquic (AHC) s'utilitzen per implementar m猫todes de 芦recuperaci贸 per exemple禄 mitjan莽ant la reducci贸 del sac d'imatges de paraules en uns pocs representants de cluster. S'avaluen diversos criteris de linkatge, diferents mesures de dist脿ncia i m猫todes d'obtenci贸 de representant. Un conjunt de dades senzill s'utilitza per crear i validar l'algoritme i un subconjunt d'una col路lecci贸 d'imatges de paraules s'utilitza per obtenir els resultats finals. El modelatge amb les imatges de paraules manuscrites mostra que AHC redueix considerablement la quantitat d'operacions (disminuci贸 del temps de petici贸) pel reconeixement d'escriptura offline, donant els mateixos resultats (i fins i tot millor) que els enfocaments tradicionals.En las tareas de reconocimiento de palabras escritas a mano a partir de una colecci贸n de manuscritos, una posible aproximaci贸n consiste en agrupar im谩genes usando una medida de similitud para obtener una distribuci贸n de cl煤ster, con el fin de tener todas las mismas palabras en el mismo grupo. Teniendo en cuenta esta idea, se utilizan t茅cnicas de clustering jer谩rquico aglomerado (AHC) para implementar la recuperaci贸n mediante m茅todos de ejemplo reduciendo el saco de im谩genes de palabras en unos cuantos representantes de cl煤ster. Se eval煤an diversos criterios de linkage, diferentes m茅tricas de distancia y m茅todos de obtenci贸n representativos. Un conjunto de datos simple es utilizado para crear y validar el algoritmo y un subconjunto de la colecci贸n de im谩genes de palabras se utiliza para obtener los resultados finales. El modelage con imagenes de palabras manuscritas muestra que AHC reduce considerablemente la cantidad de operaci贸n (disminuci贸n del tiempo de solicitud) en el reconocimiento de escritura a mano sin conexi贸n, dando los mismos resultados (e incluso mejores) que los enfoques tradicionales

    Arabic Manuscript Layout Analysis and Classification

    Get PDF
    corecore