Application of machine learning techniques to improve optical character recognition systems (OCR) on industrial surfaces

Abstract

El reconocimiento de números y letras grabadas sobre productos comerciales es de vital importancia para que una industria pueda tener la trazabilidad e identificación de sus productos. A pesar de ser esencial, el reconocimiento y la clasificación de forma automática es un problema aun sin resolver ya que existen infinidad de superficies y métodos de grabado que presentan, a su vez, grandes variaciones, siendo un reto para los algoritmos de reconocimiento por imagen que tenemos actualmente. Por tanto, para solucionar esto, en el presente proyecto vamos a abordar un modelo de reconocimiento de imágenes mediante técnicas de Deep Learning, que detecte y clasifique códigos alfanuméricos con alta precisión, independientemente de la superficie y de la técnica de grabado que se utilice. Como la solución de utilizar Deep Learning utiliza grandes cantidades de datos (imágenes en nuestro caso) vamos a generar un dataset que recoja cientos de imágenes de distintas superficies y acabados, que uniremos aleatoriamente en miles de combinaciones. Esto permitirá tener suficientes datos de la distribución con el fin de entender, de forma objetiva y medible cuales son los puntos de trabajo ideales y los casos más complejos a estudiar con el fin de establecer un camino claro para futuros avances.The recognition of numbers and letters engraved on commercial products is of vital importance so that an industry can have the traceability and identification of its products. Despite being essential, automatic recognition and classification is an unresolved problem as there are countless surfaces and engraving methods that present, in turn, great variations, being a challenge for image recognition algorithms. that we currently have. Therefore, to solve this, in this project we are going to address an image recognition model using Deep Learning techniques, which detects and classifies alphanumeric codes with high precision, regardless of the surface and the engraving technique used. As the solution to use Deep Learning uses large amounts of data (images in our case) we are going to generate a dataset that collects hundreds of images of different surfaces and finishes, which we will randomly join in thousands of combinations. This will allow having enough distribution data in order to understand, in an objective and measurable way, which are the ideal working points and the most complex cases to study in order to establish a clear path for future advances.Grado en Ingeniería en Electrónica Industrial y Automátic

    Similar works