2 research outputs found

    Multiple Contributions to Interactive Transcription and Translation of Old Text Documents

    Full text link
    There are huge historical document collections residing in libraries, museums and archives that are currently being digitized for preservation purposes and to make them available worldwide through large, on-line digital libraries. The main objective, however, is not to simply provide access to raw images of digitized documents, but to annotate them with their real informative content and, in particular, with text transcriptions and, if convenient, text translations too. This work aims at contributing to the development of advanced techniques and interfaces for the analysis, transcription and translation of images of old archive documents, following an interactive-predictive approach.Serrano Mart铆nez-Santos, N. (2009). Multiple Contributions to Interactive Transcription and Translation of Old Text Documents. http://hdl.handle.net/10251/11272Archivo delegad

    Multimodal Interactive Transcription of Handwritten Text Images

    Full text link
    En esta tesis se presenta un nuevo marco interactivo y multimodal para la transcripci贸n de Documentos manuscritos. Esta aproximaci贸n, lejos de proporcionar la transcripci贸n completa pretende asistir al experto en la dura tarea de transcribir. Hasta la fecha, los sistemas de reconocimiento de texto manuscrito disponibles no proporcionan transcripciones aceptables por los usuarios y, generalmente, se requiere la intervenci贸n del humano para corregir las transcripciones obtenidas. Estos sistemas han demostrado ser realmente 煤tiles en aplicaciones restringidas y con vocabularios limitados (como es el caso del reconocimiento de direcciones postales o de cantidades num茅ricas en cheques bancarios), consiguiendo en este tipo de tareas resultados aceptables. Sin embargo, cuando se trabaja con documentos manuscritos sin ning煤n tipo de restricci贸n (como documentos manuscritos antiguos o texto espont谩neo), la tecnolog铆a actual solo consigue resultados inaceptables. El escenario interactivo estudiado en esta tesis permite una soluci贸n m谩s efectiva. En este escenario, el sistema de reconocimiento y el usuario cooperan para generar la transcripci贸n final de la imagen de texto. El sistema utiliza la imagen de texto y una parte de la transcripci贸n previamente validada (prefijo) para proponer una posible continuaci贸n. Despues, el usuario encuentra y corrige el siguente error producido por el sistema, generando as铆 un nuevo prefijo mas largo. Este nuevo prefijo, es utilizado por el sistema para sugerir una nueva hip贸tesis. La tecnolog铆a utilizada se basa en modelos ocultos de Markov y n-gramas. Estos modelos son utilizados aqu铆 de la misma manera que en el reconocimiento autom谩tico del habla. Algunas modificaciones en la definici贸n convencional de los n-gramas han sido necesarias para tener en cuenta la retroalimentaci贸n del usuario en este sistema.Romero G贸mez, V. (2010). Multimodal Interactive Transcription of Handwritten Text Images [Tesis doctoral no publicada]. Universitat Polit猫cnica de Val猫ncia. https://doi.org/10.4995/Thesis/10251/8541Palanci
    corecore