Algorithmic problems of handwriting recognition


Maģistra darbs “Rokraksta atpazīšanas algoritmiskie jautājumi” ir izstrādāts latviešu valodā, aizņem 132.lpp. ar pielikimi, satur 4.tabulas, 43.attēlus un vairākus algoritmus. Rokraksta atpazīšana ir viena no tēlu atpazīšanas problēmām, kuras mērķis ir ar roku rakstītu tekstu pārveidot par datoram saprotamu, interpretējamu formātu. Darbā autors mēģināja apzināt rokraksta atpazīšanas nozares stāvokli un to raksturot. Rokraksta atpazīšanas nozare ir ļoti nesakārota un ļoti plaša, kas apgrūtināja šī uzdevuma izpildi. Darbā tika apkopoti vairāk kā 120 literatūras avoti. Literatūra tika skatīta visos rokraksta atpazīšanas algoritmiskos jautājumos, ietverot rokraksta pirmsapstrādi, segmentēšanu, īpašību izgūšanu un klasifikāciju. Darbā tiek skatīti gan Online, gan Offline algoritmi. Katrs no šiem jautājumiem tiek skatīts atsevišķi, analizējot atbilstošā posmā nepieciešamos algoritmus. Darbā ir raksturota virkne algoritmu, kas ietver statistiskās metodes, neironu tīklus, Markova modeļus un citus iesaistītos tematus. Algoritmi piedāvāti gan vispārīgi, gan arī dots algoritmu pielietojuma piemērs. Visbeidzot tika izstrādāta valodā C# neliela pirmsapstrādē iesaistīto algoritmu bibliotēka, kā arī uzrakstīta vilkumu atpazīšanas programma, kas parāda Rubina algoritma, lineārā diskriminatora, neironu tīklu, DTW darbību, kā arī izmanto autora izdomāto vienkāršo algoritmu. Programma ir modulāra, to var viegli papildināt ar jauniem algoritmiem gan izmantojot esošās funkcijas, gan pievienojot jaunas. Atslēgvārdi: On-line, Off-line, rekurentie neironu tīkli, rokraksta atpazīšana, rokraksta segmentēšana, Rubina algoritms, spalvas ceļa atjaunošana, vilkumu atpazīšana, DTW, neironu tīkli, lineārais diskriminators, Markova modeļi, zonēšana, rokraksta pirmsapstrāde, rokraksta pēcapstrādeThe master's theses “Algorithmical problems of Handwriting recognition” has been developed in latvian language, includes 132 pages of writen text, 4 tables, 43 images and several algorithms. The handwriting recognition is one of the pattern recognition problems, the target of which is to transform handwritten text into format recognizable by a computing system. The author has tried to aggregate the state of the handwriting recognition sector and to describe it. The sector is very broad and uncategorized, which made this process difficult. More than 120 sources of literature were covered. The sources vary across broad handwriting recognition algorithmic areas, including hadnwriting preprocessing, segmentation, feature extraction and classification. The paper includes both Online and Offline algorithms. Each of these has been observed seperatly, analyzing the respective necessary algorithms. The paper describes series of algorithms like statistical methods, neural networks, Markov models and other topics. The algorithms have been presented both generally and with relevant examples. At last, a small algorithm library involved in handwiring preprocessing has been developed in C# language. Also, a stroke recongition programm was written, which revieles Rubine algorithm, neural network, DTW functionality and which also uses a simple algorithm created by the author. The programms is modular and can be easilly sumplimented by new algorithms using both existing functions as well as perspective. Keywords: On-line, Off-line, recurrent neural network, handwriting recognition, handwriting segmentation, Rubin algorithm, replication of pen stroke, gesture recognition, DTW, neural networks, linear discriminator, Markov models, zoning, handwriging preprocessing, handwriting postprocessin

