Digital image processing in the creation of an intelligent system prototype for text detection and recognition in the labeling process of electrical cable

Abstract

El etiquetado del cable permite identificar distintas configuraciones y lotes de cables, así como conocer sus características. En el proceso de etiquetado del cable se pueden presentar distintos tipos de errores o defectos en el texto impreso, por ejemplo: ausencia de la etiqueta, corrimiento de la tinta, partes del texto faltante, texto ilegible y gotas de tinta. En este trabajo se presenta un prototipo de sistema para la validación del texto en cables eléctricos mediante técnicas de procesamiento de imágenes. El sistema propuesto integra dos etapas. En la primera etapa se propuso un método basado en clusterización por K-means que permite realizar el preprocesado de las imágenes para acondicionarlas. En la segunda etapa se realiza el reconocimiento óptico de caracteres utilizando el motor Tesseract OCR, el cual permite convertir el texto contenido en las imágenes en cadenas de caracteres. La experimentación se realizó utilizando una colección de 909 imágenes de cables eléctricos que contiene ocho tipos diferentes de cables, donde las imágenes están etiquetadas individualmente con la ground truth. La experimentación realizada permitió obtener una tasa de error promedio del 6.54%, 3.97% y 2.53% al validar el texto empleando tres, cinco y siete secuencias de etiquetas, respectivamente.Cable labeling allows identifying different configurations and batches of cables, as well as their characteristics. In the cable labeling process, different types of errors or defects can occur in the printed text, such as the absence of the label, ink bleeding, text parts missing, illegible text, and ink drops. In this paper, a prototype of a system for text validation in electrical cables using image processing techniques is presented. The proposed system consists of two stages. In the first stage, a method based on K-means clustering was proposed, allowing preprocessing images to condition them. In the second stage, optical character recognition using the Tesseract OCR engine is performed, allowing the text in the images to be converted into character strings. The experimentation was carried out using a collection of 909 images of electrical cables containing eight different types of cables, where the images are individually labeled with the ground truth. The evaluation obtained an average error rate of 6.54%, 3.97%, and 2.53% when validating the text using three, five, and seven label sequences, respectively

    Similar works