2 research outputs found

    Modelos de atenci贸n para la transcripci贸n de textos manuscritos hist贸ricos

    Get PDF
    La transcripci贸n de texto manuscrito es una tarea que cobra importancia a la par de la necesidad de conservar todo el conocimiento e historia que esconden los textos antiguos. La mayor铆a de los textos importantes de autores reputados llevan tiempo transcritos a texto digital, pero la ingente cantidad de textos menores o espec铆ficos s贸lo son abarcables con procesos industrializados, en este caso a trav茅s de software autom谩tico. La automatizaci贸n que se trata en este proyecto es una automatizaci贸n a trav茅s de modelos de deep learning, los cuales se basan en redes neuronales. Esta automatizaci贸n se lleva a cabo a partir de una imagen digitalizada del texto manuscrito, realizada manualmente, por lo que esta t茅cnica no puede conocerse como una automatizaci贸n pura. Desde la aparici贸n del OCR, son numerosos los autores que han propuesto modelos varios para dar soluci贸n a este problema. Estas soluciones abarcan desde reconocimiento de caracteres hasta reconocimiento de frases completas. El objetivo de este proyecto es presentar una soluci贸n basada en modelos de atenci贸n. De esta manera se propone que la dependencia de la transcripci贸n realizada de los caracteres anteriores y posteriores al que ocupa en cada momento puede aportar claridad y exactitud a la transcripci贸n del mismo, informaci贸n que va m谩s all谩 de las propias caracter铆sticas que presenta la imagen de cada caracter.The transcription of handwritten text takes on the importance of preserving all the knowledge and history hidden in ancient texts. Most of the known texts or those of reputed authors have been transcribed into digital text for a long time, but the huge amount of minor or specific texts can only be covered by industrialized processes, in this case through automatic software. The automation dealt with in this project is automation through deep learning models, which are based on neural networks. This automation is carried out from a digitized image of the handwritten text, which must be done by hand, so this technique cannot be known as pure automation. Since the emergence of OCR, many authors have proposed various models to solve this problem. These solutions range from character recognition to full sentence recognition. The aim of this project is to present a solution based on the attention model. In this way, it is proposed that the dependence of the transcription made of the characters next to the one it occupies at each moment can contribute to the clarity and accuracy of the transcription, thus providing information beyond the own characteristics that it presents in the image of each character.Universidad de Sevilla. M谩ster en Ingenier铆a de Telecomunicaci贸
    corecore