8 research outputs found
An Online Character Recognition System to Convert Grantha Script to Malayalam
This paper presents a novel approach to recognize Grantha, an ancient script
in South India and converting it to Malayalam, a prevalent language in South
India using online character recognition mechanism. The motivation behind this
work owes its credit to (i) developing a mechanism to recognize Grantha script
in this modern world and (ii) affirming the strong connection among Grantha and
Malayalam. A framework for the recognition of Grantha script using online
character recognition is designed and implemented. The features extracted from
the Grantha script comprises mainly of time-domain features based on writing
direction and curvature. The recognized characters are mapped to corresponding
Malayalam characters. The framework was tested on a bed of medium length
manuscripts containing 9-12 sample lines and printed pages of a book titled
Soundarya Lahari writtenin Grantha by Sri Adi Shankara to recognize the words
and sentences. The manuscript recognition rates with the system are for Grantha
as 92.11%, Old Malayalam 90.82% and for new Malayalam script 89.56%. The
recognition rates of pages of the printed book are for Grantha as 96.16%, Old
Malayalam script 95.22% and new Malayalam script as 92.32% respectively. These
results show the efficiency of the developed system.Comment: 6 pages, 6 figure
Improving on-line handwritten recognition in interactive machine translation
[EN] On-line handwriting text recognition (HTR) could be used as a more natural way of interaction in many interactive applications. However, current HTR technology is far from developing error-free systems and, consequently, its use in many applications is limited. Despite this, there are many scenarios, as in the correction of the errors of fully-automatic systems using HTR in a post-editing step, in which the information from the specific task allows to constrain the search and therefore to improve the HTR accuracy. For example, in machine translation (MT), the on-line HTR system can also be used to correct translation errors. The HTR can take advantage of information from the translation problem such as the source sentence that is translated, the portion of the translated sentence that has been supervised by the human, or the translation error to be amended. Empirical experimentation suggests that this is a valuable information to improve the robustness of the on-line HTR system achieving remarkable results.The research leading to these results has received funding from the European Union Seventh Framework Programme (FP7/2007-2013) under Grant agreement no. 287576 (CasMaCat), from the EC (FEDER/FSE), and from the Spanish MEC/MICINN under the Active2Trans (TIN2012-31723) project. It is also supported by the Generalitat Valenciana under Grant ALMPR (Prometeo/2009/01) and GV/2010/067.Alabau Gonzalvo, V.; Sanchis Navarro, JA.; Casacuberta Nolla, F. (2014). Improving on-line handwritten recognition in interactive machine translation. Pattern Recognition. 47(3):1217-1228. https://doi.org/10.1016/j.patcog.2013.09.035S1217122847
CHARACTER-LEVEL INTERACTIONS IN MULTIMODAL COMPUTER-ASSISTED TRANSCRIPTION OF TEXT IMAGES
HTR systems don't achieve acceptable results in unconstrained applications. Therefore, it is convenient
to use a system that allows the user to cooperate in the most confortable way with the system to
generate a correct transcription. In this paper, multimodal interaction at character-level is studied.Martín-Albo Simón, D. (2011). CHARACTER-LEVEL INTERACTIONS IN MULTIMODAL COMPUTER-ASSISTED TRANSCRIPTION OF TEXT IMAGES. http://hdl.handle.net/10251/11313Archivo delegad
Multimodal Interactive Transcription of Handwritten Text Images
En esta tesis se presenta un nuevo marco interactivo y multimodal para la transcripción de
Documentos manuscritos. Esta aproximación, lejos de proporcionar la transcripción completa
pretende asistir al experto en la dura tarea de transcribir.
Hasta la fecha, los sistemas de reconocimiento de texto manuscrito disponibles no proporcionan
transcripciones aceptables por los usuarios y, generalmente, se requiere la intervención
del humano para corregir las transcripciones obtenidas. Estos sistemas han demostrado ser
realmente útiles en aplicaciones restringidas y con vocabularios limitados (como es el caso
del reconocimiento de direcciones postales o de cantidades numéricas en cheques bancarios),
consiguiendo en este tipo de tareas resultados aceptables. Sin embargo, cuando se trabaja
con documentos manuscritos sin ningún tipo de restricción (como documentos manuscritos
antiguos o texto espontáneo), la tecnología actual solo consigue resultados inaceptables.
El escenario interactivo estudiado en esta tesis permite una solución más efectiva. En este
escenario, el sistema de reconocimiento y el usuario cooperan para generar la transcripción final
de la imagen de texto. El sistema utiliza la imagen de texto y una parte de la transcripción
previamente validada (prefijo) para proponer una posible continuación. Despues, el usuario
encuentra y corrige el siguente error producido por el sistema, generando así un nuevo prefijo
mas largo. Este nuevo prefijo, es utilizado por el sistema para sugerir una nueva hipótesis. La
tecnología utilizada se basa en modelos ocultos de Markov y n-gramas. Estos modelos son
utilizados aquí de la misma manera que en el reconocimiento automático del habla. Algunas
modificaciones en la definición convencional de los n-gramas han sido necesarias para tener
en cuenta la retroalimentación del usuario en este sistema.Romero Gómez, V. (2010). Multimodal Interactive Transcription of Handwritten Text Images [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/8541Palanci
Aportaciones al reconocimiento automático de texto manuscrito
En esta tesis se estudia el problema de la robustez en los sistemas de
reconocimiento automático de texto manuscrito off-line. Los sistemas de
reconocimiento automático de texto manuscrito estarán maduros para su uso
generalizado, cuando sean capaces de ofrecer a cualquier usuario, sin ningún
tipo de preparación o adiestramiento para su utilización, una productividad
razonable. Se hace necesario pues, construir sistemas flexibles y robustos en
cuanto a la entrada, de tal manera que no se requiera del escritor ningún
esfuerzo extra, que no haría si escribiese para ser leído por un humano.
La intención del preproceso de la señal es hacer el sistema invariante a
fuentes de variabilidad que no ayuden a la clasificación. En la actualidad no
hay definida una solución general para conseguir invariabilidad al estilo de
escritura, y cada sistema desarrolla la suya ad-hoc. En esta tesis se
explorarán diferentes métodos de normalización de la señal de entrada
off-line. Para ello se hace un amplio estudio de algoritmos de preproceso,
tanto a nivel de toda la imagen: umbralización, reducción del ruido y
corrección del desencuadre; como a nivel de texto: slope, slant y
normalización del tamaño de los caracteres.
Los sistemas dependientes del escritor obtienen mejores tasas de acierto
que los independientes del escritor. Por otra parte, los sistemas
independientes del escritor tienen más facilidad para reunir muestras de
entrenamiento. En esta tesis seestudiará la adaptación de sistemas
independientes del escritor para su utilizaciónpor un único escritor, con la
intención de que a partir de una pocas muestras producidas por este escritor
se mejore la productividad del sistema (para este escritor), o lo que es lo
mismo, que éste pueda escribir de manera más relajada sin que el
sistema pierda productividad. Los sistemas de reconocimiento de texto
manuscrito no están exentos de errores. No sólo interesa saber el número de
errores que produciráPastor Gadea, M. (2007). Aportaciones al reconocimiento automático de texto manuscrito [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/1832Palanci