Förvrängningar av naturliga bilder ochträffsäkerhet hos optiskteckenigenkänning

Abstract

Current state of the art optical character recognition tools are trained using high quality image datasets. In practical applications, natural images used for character recognition willnot always be of high quality. This report examines the accuracy of a state of the art optical character recognition tool using three distorted natural image datasets. The performed distortions were lossy JPEG compression, contrast reduction and white gaussian noise injection. The accuracy is presented as an average percentage of correct and located text using the Levenshtein distance algorithm. The results indicate that white gaussian noise injection significantly reduced OCR accuracy. On the other hand, lossy JPEG compressionand contrast reduction had a similar, but less of an effect.Nuvarande moderna verktyg för optisk teckenigenkänning tränas med bilder av hög kvalité. I praktiska situationer kommer naturliga bilder som används för optisk teckenigenkänning inte alltid vara av hög kvalité. Denna rapport använder tre förvrängda datauppsättningar av naturliga bilder för att utvärdera träffsäkerheten hos ett modernt verktyg för optiskteckenigenkänning. De utförda förvrängningarna var förstörande JPEG komprimering, kontrastreducering och injektion av vitt gaussiskt brus. Träffsäkerheten presenteras som en genomsnittlig procentenhet av korrekt och lokaliserad text genom användning av algoritmen Levenshteinavstånd. Resultaten indikerar att injektion av vitt gaussiskt brus försämrade träffsäkerheten hos optisk teckenigenkänning avsevärt. Vidare hade förstörande JPEG­ komprimering och kontrastreducering en liknande, men mindre, effekt

    Similar works

    Full text

    thumbnail-image

    Available Versions