2,123 research outputs found

    Deep Learning para la Detección de Peatones y Vehículos

    Get PDF
    Dado el reciente desarrollo y el impacto que ha tenido el paradigma de Deep Learning en el campo de la Inteligencia Artificial, el presente trabajo tiene como base el interés en este paradigma de aprendizaje, en específico empleando redes neuronales convolucionales (CNNs), para la detección o clasificación de objetos en imágenes; además se analiza las ventajas de implementar estos algoritmos en hardware. El objeto de estudio del aprendizaje automático es tratar de emular la inteligencia humana de forma artificial. Se ha trabajado en este campo por años, con diferentes enfoques y algoritmos. En la última década, el paradigma del Deep Learning ha revolucionado el estado del arte en tareas como reconocimiento de voz, visión artificial y el procesamiento del lenguaje natural; que resultaban difíciles de llevar a cabo por una máquina. Las técnicas que predominan en este paradigma son las CNNs, se utilizan como principal algoritmo en tareas que involucran visión artificial, tales como la detección de objetos. Se ha logrado un despunte importante en el reconocimiento de patrones en imágenes y video empleando estas técnicas, al grado de superar la capacidad humana. Un factor importante para ese desarrollo es la capacidad de procesar altos volúmenes de información en aplicaciones exitosas, lo que ha derivado en que los dispositivos empleados para dicho propósito, como GPUs y CPUs multinúcleo requieran de gran cantidad de energía para su funcionamiento. Recientemente, han surgido investigaciones enfocadas en buscar alternativas de hardware, sobre el cual implementar las CNNs de forma eficiente, sobre todo para aplicaciones embebidas. Una de estas alternativas son los Arreglos de Compuertas Programables en Campo (FPGAs), que ofrecen la capacidad de procesamiento en paralelo espacial y temporal, un menor tiempo de latencia y bajo consumo de potencia; lo que resulta ideal para ese tipo de aplicaciones. El presente trabajo se divide en dos partes, por un lado se hace la implementación del paradigma Deep Learning con una CNN para clasificar imágenes de señales de tránsito vehicular (como primer caso de estudio), con el propósito de medir el tiempo de entrenamiento y su desempeño en la clasificación. Por otro lado, se investiga la tecnología relacionada con FPGAs, para determinar la forma en que se puede acelerar el cómputo implicado en ese tipo de redes con estos dispositivos, validándolos como una alternativa de implementación para sistemas embebidos. Los resultados obtenidos en la presente investigación son: 1) La programación, entrenamiento y prueba de una CNN. Se realizaron una serie de experimentos, encontrando un error en la clasificación de 3.25% y un tiempo de entrenamiento de 0.33 horas, para los mejores casos de los ensayos realizados. 2) Se analizan las ventajas de implementar este tipo de algoritmos en FPGAs, sus restricciones, requisitos y tres alternativas de desarrollo.CONACY

    Implementación de técnicas de deep learning

    Get PDF
    En este TFG se mostrarán algunas de las técnicas y mecanismos más importantes y destacados de este Deep Learning, así como diferentes ejemplos prácticos, culminando en un pequeño proyecto final de aprendizaje profundo haciendo uso de diferentes librerías del lenguaje Python

    Desarrollo de librería para manejo de redes neuronales en Java para tecnofactor

    Get PDF
    En el presente proyecto de grado se pretende diseñar y desarrollar una librería de trabajo que pueda ser utilizada para la creación y entrenamiento de Redes Neuronales, definida de manera que su uso sea sencillo por parte de desarrolladores Java. Se utilizará la librería desarrollada para diseñar y obtener una red neuronal capaz de reconocer dígitos escritos a mano, a partir de la base de datos MNIST.The aim of the present project is to design and develop a working library that enables the creation and adaptation of Neural Networks, defined in a way that is simple to use by Java developers. The developed library will be used to design and obtain a neural network capable of recognizing handwritten digits, from the MNIST database

    Sistema recomendador de objetos de aprendizaje, basado en la metodología de deep learning, para el reconocimiento de estilos de aprendizaje que mejoren el desempeño de los estudiantes en la educación básica regular (EBR 2017)

    Get PDF
    En la educación moderna es muy importante diferenciar el estilo de aprendizaje para tratar de mejorar la enseñanza y en consecuencia el aprendizaje, al presentar información adecuada al estilo de aprendizaje de los estudiantes. Por esta razón este trabajo propone utilizar una red DENSENET como sistema de recomendación de estilo de aprendizaje, se entrena un modelo con un conjunto de datos de 500 imágenes de dibujos de paisajes. El sistema es capaz de predecir estilos de aprendizaje. Esta propuesta, alcanzó una precisión del 87,77% que es buena para orientar a los estudiantes de secundaria en el proceso de aprendizaje

    Application of machine learning techniques to improve optical character recognition systems (OCR) on industrial surfaces

    Get PDF
    El reconocimiento de números y letras grabadas sobre productos comerciales es de vital importancia para que una industria pueda tener la trazabilidad e identificación de sus productos. A pesar de ser esencial, el reconocimiento y la clasificación de forma automática es un problema aun sin resolver ya que existen infinidad de superficies y métodos de grabado que presentan, a su vez, grandes variaciones, siendo un reto para los algoritmos de reconocimiento por imagen que tenemos actualmente. Por tanto, para solucionar esto, en el presente proyecto vamos a abordar un modelo de reconocimiento de imágenes mediante técnicas de Deep Learning, que detecte y clasifique códigos alfanuméricos con alta precisión, independientemente de la superficie y de la técnica de grabado que se utilice. Como la solución de utilizar Deep Learning utiliza grandes cantidades de datos (imágenes en nuestro caso) vamos a generar un dataset que recoja cientos de imágenes de distintas superficies y acabados, que uniremos aleatoriamente en miles de combinaciones. Esto permitirá tener suficientes datos de la distribución con el fin de entender, de forma objetiva y medible cuales son los puntos de trabajo ideales y los casos más complejos a estudiar con el fin de establecer un camino claro para futuros avances.The recognition of numbers and letters engraved on commercial products is of vital importance so that an industry can have the traceability and identification of its products. Despite being essential, automatic recognition and classification is an unresolved problem as there are countless surfaces and engraving methods that present, in turn, great variations, being a challenge for image recognition algorithms. that we currently have. Therefore, to solve this, in this project we are going to address an image recognition model using Deep Learning techniques, which detects and classifies alphanumeric codes with high precision, regardless of the surface and the engraving technique used. As the solution to use Deep Learning uses large amounts of data (images in our case) we are going to generate a dataset that collects hundreds of images of different surfaces and finishes, which we will randomly join in thousands of combinations. This will allow having enough distribution data in order to understand, in an objective and measurable way, which are the ideal working points and the most complex cases to study in order to establish a clear path for future advances.Grado en Ingeniería en Electrónica Industrial y Automátic

    Sistema de reconocimiento óptico de dígitos en dispositivos móviles para mejorar el procesamiento de etiquetas manuscritas de inventario

    Get PDF
    El objetivo del presente estudio es evaluar un Sistema de Reconocimiento Óptico de Dígitos basado en Dispositivo Móvil, para mejorar el procesamiento de las etiquetas manuscritas en la elaboración del inventario en la Empresa Municipal de Agua Potable y Alcantarillado de la provincia de Cañete en el año 2015. Se desarrolló una aplicación móvil para el Reconocimiento Óptico de Dígitos, que funciona en un Smartphone de fabricación Samsung modelo Galaxy Pocket Neo, con 1 GB de memoria interna, cámara fotográfica con resolución de 640 x 480 pixeles, con Sistema Operativo Android versión 4.2. La tecnología para la identificación, clasificación y reconocimiento de los dígitos manuscritos, que se empleó está basada en una red Neuronal de una capa llamada Perceptron. Para la identificación y descripción de los requerimientos de la aplicación móvil se empleó la metodología basado en requerimientos y UML para el modelamiento, tanto en el análisis, diseño y programación se empleó la metodología orientado a objetos. El presente estudio es explicativo y experimental. El propósito es demostrar que el Sistema de Reconocimiento Óptico desarrollado reduce los tiempos, costos y errores en la lectura de las etiquetas manuscritas en el proceso de la elaboración del inventario de los bienes patrimoniales. Se trabajó con una muestra de 100 etiquetas de inventarios manuscritas. Como instrumentos de recolección de datos se emplearon registros de observación en donde se registraban la efectividad de la toma fotográfica de los códigos manuscritos en las etiquetas y el tiempo que le llevaba al sistema el reconocimiento efectivo de los códigos. Con los datos obtenidos se calcularon la tasa de efectividad en el reconocimiento de los códigos manuscritos, el tiempo de respuesta del sistema y la reducción de los costos. Según el análisis de los resultados demuestra que el Sistema de Reconocimiento de Dígitos en referencia tiene una efectividad del 91.67% el cual se considera aceptable

    Sistema basado en redes neuronales para el reconocimiento de dígitos manuscritos

    Get PDF
    Este proyecto surge de la necesidad de mejorar el módulo de reconocimiento de dígitos del sistema Eyegrade. Este sistema realiza la corrección automática de exámenes tipo test mediante una cámara web. El modulo a mejorar sirve para identificar cada examen con un número de identificación del que dispone cada alumno. De esta manera la corrección es totalmente automática, sencilla de realizar e independiente de la acción humana. En este trabajo se han estudiado diferentes alternativas por las que resolver este problema, usando la Inteligencia Computacional , nuevas técnicas que cada vez van tomando más relevancia en el mercado para automatizar decisiones que suele hacer el ser humano. Después de estudiar y evaluar las diferentes alternativas para el problema planteado y las diferentes opciones que había para implementarlas, se decidió optar por las redes neuronales. Se pensó en hacer primero un prototipo de la solución en un entorno que nos facilitara su implementación, ya que era una gran ventaja. Se decidió que fuera MATLAB ©. Una vez se tuvieron todos los parámetros, tanto de las imágenes como de la red neuronal, se implementó el nuevo modulo en el lenguaje de Python,y así poderlo integrar con el sistema del cual surge esta necesidad. Las imágenes utilizadas para los experimentos, tanto en el prototipo de la solución como en el sistema nal, eran reales y extraídas de exámenes de la Universidad Carlos III de Madrid, con las que se pudieron extraer los resultados nales. ___________________________________________________________________________________________________________________________This project emerges from the necessity to improve the digit recognition module Eyegrade system. This system executes the automatic correction for multiple-choice exams through a web-cam. The module at improving is useful to identify each exam with an ID number which belongs to each student. In this way, the correction is fully automatic, easy to perform and independently of human action. In this work, diff erent alternatives have been studied to solve this problem, using soft computing , new techniques which are becoming more relevant in the market to automate decisions that often are done by humans. After studying and evaluating the diff erent alternatives for the problem and the various options that had to be implemented, the chosen option was the neural networks. Firstly, a prototype of the solution was made in an environment that we provide implementation, as it was a great advantage. MATLAB©was the chosen one. When all the parameters were taken not only the images but the neural network as well, it was implemented in the Python language, for integrating with the system. Both the prototype of the solution and the final system, were performed with real images from exams of the Carlos III University of Madrid. The fi nal results were obtained with the mentioned images.Ingeniería Técnica en Sonido e Image

    Diseño e implementación de un prototipo de procesamiento digital de imágenes para la detección y conteo de ovinos mediante un Drone

    Get PDF
    El conteo de ovinos es una tarea que muchos ganaderos realizan para tener un mejor control, asimismo el buen manejo es impulsado por las instituciones del gobierno para la mejora de la calidad del ganado en el Perú y principalmente en la región Puno donde se promueve su crianza para la producción de lana y carne en el mercado nacional. En este trabajo de investigación se plantea el diseño e implementación de un prototipo de procesamiento digital de imágenes para la detección y conteo de ovinos mediante un Drone, teniendo como base principal imágenes y videos, los cuales son procesados para obtener únicamente las características principales los cuales son usados para detectarlos y contarlos. Los algoritmos a aplicar son: límite de color y detección de patrones mediante Haar-Cascade, esta última tiene como base fundamental el uso de una imagen integral, adaboost y el método cascade. Estos métodos implementados son una potente herramienta que permite adaptar características de objetos personalizados. Las fuentes de video transmitido de un drone con formatos de vídeo de alta calidad permiten observar y capturar muchas características que simplemente al ojo humano pueden ser ignoradas. Los drones proveen captura de video que puede ser direccionado a una base de datos donde su procesamiento es realizado por los algoritmos de detección y conteo, este sistema cuantifica y permite conocer la cantidad de ovinos.Tesi

    Plataforma de evaluación de algoritmos de reconocimiento de caracteres numéricos en imágenes digitales.

    Get PDF
    La investigación tuvo como objetivo evaluar las técnicas de reconocimiento de dígitos en imágenes: K-Nearest Neighbor (KNN), TESSERACT y Redes Neuronales Artificiales (RNA); lo que permitió determinar la técnica con mayor nivel de precisión que podrá ser utilizada en diferentes aplicaciones de visión artificial. Se planteó la hipótesis de investigación “La selección adecuada de la técnica de reconocimiento de caracteres numéricos en imágenes digitales permitirá determinar la técnica con el mayor grado de precisión y minimizar el consumo de recursos en computadores SBC”. Se utilizó la prueba no paramétrica de Kruskal-Wallis en la comparación del grado de precisión de las técnicas con un nivel de confianza del 95%. Los indicadores que se utilizaron son: grado de precisión, tiempo empleado para el reconocimiento, cantidad de memoria ram y nivel de uso del CPU. Se utilizó una muestra ponderada de 30 fotografías tomadas a medidores de energía eléctrica de la ciudadela Las Acacias de la ciudad de Riobamba. De acuerdo a los resultados de las pruebas estadísticas se determinó que la técnica de reconocimiento con mayor grado de precisión fue KNN alcanzando un promedio de 49,33% frente a 29,833% y 22,00% de TESSERACT y RNA respectivamente. El tiempo promedio empleado por KNN para el reconocimiento fue de 1,22 segundos, en promedio se utilizó 15,7 megabytes de memoria ram y 11,64% de uso del CPU. Se utilizó OpenCV, Python y C++ bajo la distribución Raspbian de Linux para evaluar cada una de las técnicas seleccionadas. Se recomienda profundizar en el estudio de la técnica KNN enfocadas a diferentes aplicaciones de visión artificial en la industria, así como evaluar nuevas técnicas de reconocimiento de patrones como SVM, Deep Learning y Aprendizaje no Supervisado, que se han convertido en campos de investigación activos en muchas universidades del mundo.The research aimed to evaluate the techniques of digit recognition in images: K-Nearest Neighbor (KNN), TESSERACT and Artificial Neural Networks (RNA); Which allowed to determine the technique with greater level of precision that can be used in different applications of artificial vision. The research hypothesis "The proper selection of numerical carácter recognition technique in digital images will allow to determine the technique with the highest degree of accuracy and to minimize the consumption of resources in SBC computers." The nonparametric Kruskal-Wallis test was used in the comparison of the degree of precision of the techniques with a confidence level of 95%. The indicators that were used are: degree of precision, time spent for recognition, amount of RAM and level of CPU usage. A sample was used of 30 photographs taken at electric power meters of Las Acacias in Riobamba city. According to the statistical tests results, was determined that the most accurate recognition technique was KNN reaching an average of 49.33% versus to 29.833% and 22.00% of TESSERACT and RNA respectively. The average time spent by KNN for the recognition was 1.22 seconds, on average 15.7 megabytes of RAM and 11.64% of CPU usage were used. OpenCV, Python and C ++ were used under the Linux Raspbian distribution to evaluate each selected techniques. It is recommended to deepen the study of the KNN technique focused on different applications of artificial visión in the industry, as well as to evaluate new recognition techniques of Pattern such as SVM, Deep Learning and Non-Supervised Leanring, which have become active research fields in many universities around the world
    corecore