2 research outputs found
Multiple Contributions to Interactive Transcription and Translation of Old Text Documents
There are huge historical document collections residing in libraries, museums and archives
that are currently being digitized for preservation purposes and to make them available
worldwide through large, on-line digital libraries. The main objective, however, is not
to simply provide access to raw images of digitized documents, but to annotate them with
their real informative content and, in particular, with text transcriptions and, if convenient,
text translations too. This work aims at contributing to the development of advanced
techniques and interfaces for the analysis, transcription and translation of images of old
archive documents, following an interactive-predictive approach.Serrano Mart铆nez-Santos, N. (2009). Multiple Contributions to Interactive Transcription and Translation of Old Text Documents. http://hdl.handle.net/10251/11272Archivo delegad
Multimodal Interactive Transcription of Handwritten Text Images
En esta tesis se presenta un nuevo marco interactivo y multimodal para la transcripci贸n de
Documentos manuscritos. Esta aproximaci贸n, lejos de proporcionar la transcripci贸n completa
pretende asistir al experto en la dura tarea de transcribir.
Hasta la fecha, los sistemas de reconocimiento de texto manuscrito disponibles no proporcionan
transcripciones aceptables por los usuarios y, generalmente, se requiere la intervenci贸n
del humano para corregir las transcripciones obtenidas. Estos sistemas han demostrado ser
realmente 煤tiles en aplicaciones restringidas y con vocabularios limitados (como es el caso
del reconocimiento de direcciones postales o de cantidades num茅ricas en cheques bancarios),
consiguiendo en este tipo de tareas resultados aceptables. Sin embargo, cuando se trabaja
con documentos manuscritos sin ning煤n tipo de restricci贸n (como documentos manuscritos
antiguos o texto espont谩neo), la tecnolog铆a actual solo consigue resultados inaceptables.
El escenario interactivo estudiado en esta tesis permite una soluci贸n m谩s efectiva. En este
escenario, el sistema de reconocimiento y el usuario cooperan para generar la transcripci贸n final
de la imagen de texto. El sistema utiliza la imagen de texto y una parte de la transcripci贸n
previamente validada (prefijo) para proponer una posible continuaci贸n. Despues, el usuario
encuentra y corrige el siguente error producido por el sistema, generando as铆 un nuevo prefijo
mas largo. Este nuevo prefijo, es utilizado por el sistema para sugerir una nueva hip贸tesis. La
tecnolog铆a utilizada se basa en modelos ocultos de Markov y n-gramas. Estos modelos son
utilizados aqu铆 de la misma manera que en el reconocimiento autom谩tico del habla. Algunas
modificaciones en la definici贸n convencional de los n-gramas han sido necesarias para tener
en cuenta la retroalimentaci贸n del usuario en este sistema.Romero G贸mez, V. (2010). Multimodal Interactive Transcription of Handwritten Text Images [Tesis doctoral no publicada]. Universitat Polit猫cnica de Val猫ncia. https://doi.org/10.4995/Thesis/10251/8541Palanci