    Tato práce se zabývá problematikou rozpoznávání textu v obraze a těmi metodami zpracování obrazu, které rozpoznání textu napomáhají. Zvláště se zaměřuje na problematiku obrazového spamu a jeho úpravu pro rozpoznání. Popisuje metody zpracování obrazu, které vedou k takové úpravě obrazu, aby byl v něm obsažený text snadněji rozpoznatelný, a některé metody využívané pro rozpoznávání znaků. V práci je také popsán návrh a implementace systému, který zpracovává obrazový spam a detekuje v něm obsažený text.This work describes problems of optical character recognition and methods which are used to improve its results. It specializes in problems of image spam and its adjustment for its recognition. This work describes methods of processing an image which leads to better results of text recognition and also some methods used to the character recognition. There is also described a scheme and an implementation of a system which processes an image spam and detects a text within it.

    V této práci jsou představeny některé z metod pro vyhledání a rozpoznání textu v obraze. Zabývá se problematikou extrakce příznaků a představuje nejčastěji používané algoritmy strojového učení. Popisuje postup při návrhu a implementaci aplikace určené k rozpoznávání tištěného textu a vytvoření datové sady znaků.This paper presents some of the methods for locating and recognizing text in an image document. It describes feature extraction issues and commonly used machine learning algorithms. In the latest part, there is description of design and implementation of application for printed text recognition.


    Penerapan Optical Character Recognition Untuk Pembacaan Meter Air<br>Optical Character Recognition Application For Water Meter Reading

    ABSTRAKSI: Optical Character Recognition (OCR) adalah sebuah sistem komputer yang digunakan untuk mengenali serangkaian karakter yang berasal dari mesin ketik, mesin cetak ataupun tulisan tangan dalam format digital. OCR memungkinkan dapat menggantikan metode pencatatan meter air saat ini yang kurang efisien,dimana petugas meter air mencatat satu persatu ke rumah-rumah pelanggan dan dipindahkan satu persatu dengan mengetik secara manual ke komputer. Dengan kata lain OCR dapat mempermudah dalam proses pencatatan, dengan membaca citra meter air menjadi file teks tanpa harus pengetikan ulang. Selain itu metode pencatatan OCR yang menggunakan citra meter air dapat mengatasi rekayasa yang terjadi dilapangan sehingga dapat menaikan tingkat kepuasan konsumen.Pada Tugas akhir ini dikembangkan suatu aplikasi untuk membaca angka yang tercantum pada meter air dari sebuah file citra hasil pemotretan camera digital berformat jpg. Proses pengenalan angka pada sistem ini terdiri dari penentuan posisi angka pada meter air, pengolahan citra untuk meningkatkan kualitas dan menyederhanakan citra, segmentasi citra angka perkarakter dan sesetelah mendapatkan ciri–ciri dari karakter angka meter air kemudian disimpan sebagai fitur acuan untuk penentuan dan pembacaan angka.Pengujian dilakukan pada 90 citra meter air dengan membaca 4-5 angka terdepan yang digunakan sebagai penentu pemakaian pelanggan. Secara keseluruhan akurasi sistem untuk pembacaan karakter angka adalah sebesar 96.4% dengan waktu pengenalan rata-rata 0.213505 detik per meter air.Kata Kunci : Optical Character Recognition,meter air,capture,training, jpgABSTRACT: Optical Character Recognition (OCR) is a computer system used to identify a series of characters that come from the typewriter, printing or handwriting in digital format. OCR enables to replace the current water meter reading method that is less efficient, in which officers record the water meter one by one from customers and also transferred one by one by typing it manually into the computer. In other words, the OCR can facilitate the process of recording, by reading the water meter image into text files without retyping. In addition, OCR water meter imagery recording method can handle the fraud happens in the field so as to raise the level of customer satisfaction.This Final Project developed an application to read numbers contained in water meter that is taken from a digital camera image formatted in jpg. The process of identifying numbers in this system consist of positioning the numbers in water meter, image processing to improve the quality and simplify the image, segmenting the numbers image by character and after obtaining the traits of water meter image, it will be stored as a reference feature for numbers determining and reading.Tests conducted on 90 water meter images by reading 4 – 5 first digits that is used as a determinant of costumer water usage. Overall, the accuracy of this system for reading the character of numbers is 96.4% with an average recognition time 0.213505 seconds per meter of water.Keyword: Optical Character Recognition,meter air,capture,training, jp