21 research outputs found

    Modelos de aprendizaje automático en la detección e identificación de personas: una revisión de literatura

    Get PDF
    Introduction: This article is the result of research entitled "Development of a prototype to optimize access conditions to the SENA-Pescadero using artificial intelligence and open-source tools", developed at the Servicio Nacional de Aprendizaje in 2020.   Problem: How to identify Machine Learning Techniques applied to computer vision processes through a literature review? Objective: Determine the application, as well as advantages and disadvantages of machine learning techniques focused on the detection and identification of people. Methodology: Systematic literature review in 4 high-impact bibliographic and scientific databases, using search filters and information selection criteria. Results: Machine Learning techniques defined as Principal Component Analysis, Weak Label Regularized Local Coordinate Coding, Support Vector Machines, Haar Cascade Classifiers and EigenFaces and FisherFaces, as well as their applicability in detection and identification processes.   Conclusion: The research led to the identification of the main computational intelligence techniques based on machine learning, applied to the detection and identification of people. Their influence was shown in several application cases, but most of them were focused on the implementation and optimization of access control systems, or tasks in which the identification of people was required for the execution of processes. Originality: Through this research, we studied and defined the main machine learning techniques currently used for the detection and identification of people. Limitations: The systematic review is limited to information available in the 4 databases consulted, and the amount of information is variable as articles are deposited in the databases.Introducción: Este artículo es el resultado de la investigación titulada " Desarrollo de un prototipo para optimizar las condiciones de acceso al SENA-Pescadero utilizando inteligencia artificial y herramientas de código abierto", desarrollada en el Servicio Nacional de Aprendizaje en 2020. Problema: ¿Cómo identificar las técnicas de aprendizaje automático aplicadas a los procesos de visión por computador a través de una revisión bibliográfica? Objetivo: Determinar la aplicación, así como las ventajas y desventajas de las técnicas de aprendizaje automático enfocadas a la detección e identificación de personas. Metodología: Revisión sistemática de la literatura en 4 bases de datos bibliográficas y científicas de alto impacto, utilizando filtros de búsqueda y criterios de selección de información. Resultados: Técnicas de aprendizaje automático definidas como Análisis de Componentes Principales, Codificación Local de Coordenadas Regularizada de Etiquetas Débiles, Máquinas de Vectores de Soporte, Clasificadores en Cascada de Haar y EigenFaces y FisherFaces, así como su aplicabilidad en procesos de detección e identificación. Conclusiones: La investigación permitió identificar las principales técnicas de inteligencia computacional basadas en machine learning aplicadas a la detección e identificación de personas. Su influencia se mostró en varios casos de aplicación, pero la mayoría de ellos se centraron en la implementación y optimización de sistemas de control de acceso, o tareas en las que se requería la identificación de personas para la ejecución de procesos Originalidad: A través de esta investigación se estudiaron y definieron las principales técnicas de machine learning utilizadas actualmente para la detección e identificación de personas

    Substracción de fondo y algoritmo yolo: Dos métodos para la detección de personas en entornos descontrolados

    Get PDF
    Introduction: This article is the result of research entitled “Signal processing system for the detection of people in agglomerations in areas of public space in the city of Cúcuta”, developed at the Universidad Francisco de Paula Santander in 2020.Problem: The high percentage of false positives and false negatives in people detection processes makes decision making in video surveillance, tracking and tracing applications complex. Objective: To determine which technique for the detection of people presents better results in terms of respon-se time and detection hits.Methodology: Two techniques for the detection of people in uncontrolled environments are validated in Python with videos taken inside the Universidad Francisco de Paula Santander: Background subtraction and the YOLO algorithm.Results: With the background subtraction technique, we obtained a hit rate of 84.07 % and an average response time of 0.815 seconds. Likewise, with the YOLO algorithm the hit rate and average response time are 90% and 4.59 seconds respectively.Conclusion: It is possible to infer the use of the background subtraction technique in hardware tools such as the Pi 3B+ Raspberry board for processes in which the analysis of information in real time is prioritized, while the YOLO algorithm presents the characteristics required in the processes in which the information is analyzed after the acquisition of the image.Originality: Through this research, aspects required for the real-time analysis of information obtained in pro-cesses of people detection in uncontrolled environments were analyzed. Limitations: The analyzed videos were taken only at the Universidad Francisco de Paula Santander. Also, the Raspberry Pi 3B+ board overheats when processing the video images, due to the full resource requirement of the device.Introducción: Este artículo es resultado de la investigación titulada “Sistema de procesamiento de señales para la detección de personas en aglomeraciones en zonas de espacio público de la ciudad de Cúcuta”, desarrollada en la Universidad Francisco de Paula Santander en el año 2020.Problema: El alto porcentaje de falsos positivos y falsos negativos en los procesos de detección de personas hace que la toma de decisiones en las aplicaciones de videovigilancia, seguimiento y localización sea compleja. Objetivo: Determinar qué técnica de detección de personas presenta mejores resultados en cuanto a tiempo de respuesta y aciertos en la detección.Metodología: Dos técnicas para la detección de personas en entornos no controlados son validadas en Python con videos tomados dentro de la Universidad Francisco de Paula Santander: la sustracción de fondo y el al-goritmo YOLO.Resultados: Con la técnica de sustracción de fondo se obtuvo una tasa de acierto del 84,07 % y un tiempo de respuesta medio de 0,815 segundos. Asimismo, con el algoritmo YOLO, la tasa de acierto y el tiempo de respuesta promedio son del 90% y 4,59 segundos respectivamente.Conclusión: Es posible inferir el uso de la técnica de sustracción de fondo en herramientas de hardware como la placa Raspberry Pi 3B+ para procesos en los que se prioriza el análisis de la información en tiempo real, mientras que el algoritmo YOLO presenta las características requeridas en los procesos en los que se analiza la información después de la adquisición de la imagen.Originalidad: A través de esta investigación se analizaron los aspectos necesarios para el análisis en tiempo real de la información obtenida en los procesos de detección de personas en ambientes no controlados

    TECNOLOGÍAS DE CÓDIGO ABIERTO PARA LA GESTIÓN DE UN PROCESO INDUSTRIAL

    Get PDF
    El artículo presenta una solución tecnológica para la automatización de un proceso industrial utilizando herramientas de software y hardware basadas en código abierto, propuesta que incorpora la movilidad en los niveles de supervisión y gestión de la pirámide de automatización. Esta solución se desarrolló ejecutando una metodología soportada en la ingeniería básica y de detalle, y se probó en un sistemaneumático de estampado de piezas. La propuesta utiliza un sistema embebido como controladorimplementado en una Raspberry Pi, en donde se programa un instrumento virtual que permite manipular en tiempo real el proceso, e integrarlo con la aplicación móvil desarrollada en Androidpara la gestión del mismo. Además, el artículo muestra los resultados de la evaluación de las 6 M’s y la usabilidad, realizada a la aplicación, que evidencian el potencial de éxito y la capacidad de ser  comprendida, aprendida y usada; sustentado la posibilidad de utilizar herramientas de código abierto para mejorar la competitividad de las MIPYMES.PALABRAS CLAVES: Dispositivo Móvil, Instrumentación Virtual, Proceso Industrial, SistemaEmbebido. The paper presents a technological solution for the automation of an industrial process using software and hardware tools based on open source, the solution incorporates the mobility in the levels of supervision and management of the automation pyramid. This solution was developed by running a methodology supported in basic and detailed engineering, and was tested on a pneumatic system of stamping parts. The proposal uses an embedded and implemented in a Raspberry Pi, where program controller system a virtual instrument that allows real-time manipulate the process, and integrate with the Android mobile application developed for management. In addition, the paper shows the results of the evaluation of 6 M’s and usability, on the implementation, that demonstrate the potential for success and the ability to be understood, learned and used; supported the possibility of using open source tools to improve the competitiveness of MIPYMES. KEYWORDS: Embedded System, Industrial Process, Mobile Device, Virtual Instrumentation. 

    CARACTERIZACIÓN PARA LA UBICACIÓN EN LA CAPTURA DE VIDEO APLICADO A TÉCNICAS DE VISIÓN ARTIFICIAL EN LA DETECCIÓN DE PERSONAS

    Get PDF
    Este documento muestra los resultados de la caracterización para la ubicación del dispositivo de captura de video para implementar en Python las técnicas de visión artificial de sustracción de fondo, detectores en cascada y flujo óptico, utilizadas en la detección de personas. Se confrontaron aspectos como altura y ángulo de inclinación del dispositivo, obteniendo una exactitud de 98.34% para la técnica de sustracción de fondo, con la cámara ubicada a 4 metros de altura con inclinación de 50°, siendo la de mejor rendimiento en el número de detecciones. En promedio, las pruebas realizadas a 4 metros presentan rendimiento de 87.96%, a 8 metros, 88.19%, a 50°, 87.94% y a 90° el rendimiento es de 88.19%

    Análisis de resultados de aprendizaje en programas de ingeniería

    Get PDF
    Introduction: The present review article is the product of the research “Teaching digital modulation techniques in engineering: experiential learning theory “ developed at the Franciso de Paula Santander University and Pontificia Universidad Javeriana in 2022. Problem: The learning outcomes correspond to the statements related to what the future engineer is expected to be able to do, learn, understand and demonstrate. Objective: Analyze learning outcomes in engineering programs globally. Methodology: A methodology based on analysis stages is used for information selection through search filters and inclusion and exclusion criteria, design for the classification of information by geographic location and area of knowledge, with qualitative results by location and trends by area of knowledge. Results: Divergence was observed towards the way in which learning outcomes are evaluated, and convergence towards the need to involve agents external to the academy in the feedback for the learning outcomes evaluation processes. Conclusion: This allows for the identification of individual and collective strengths and weaknesses, which helps to make informed decisions to improve the quality of education. Originality: Originality is based on the way in which the information is analyzed, considering information by areas of knowledge as well as by continents. Limitations: None given the nature of the literature review.Introducción: El presente artículo de revisión es producto de la investigación “Enseñanza de las técnicas de modulación digital en ingeniería: una mirada desde la teoría del aprendizaje experiencial” desarrollada en la Universidad Francisco de Paula Santander y la Pontificia Universidad Javeriana en 2022. Problema: Los resultados de aprendizaje corresponden a los enunciados relacionados con lo que se espera que el futuro ingeniero sea capaz de hacer, aprender, comprender y demostrar. Objetivo: Analizar los resultados de aprendizaje en los programas de ingeniería a nivel mundial. Metodología: Se utiliza una metodología basada en etapas de análisis para la selección de la información a través de filtros de búsqueda y criterios de inclusión y exclusión, diseño para la clasificación de la información por ubicación geográfica y área de conocimiento, con resultados cualitativos por ubicación y tendencias por área de conocimiento. Resultados: Se observó divergencia hacia la forma de evaluar los resultados de aprendizaje y convergencia hacia la necesidad de involucrar a agentes externos a la academia en la retroalimentación de los procesos de evaluación de resultados de aprendizaje. Conclusiones: Esto permite identificar las fortalezas y debilidades individuales y colectivas, lo que ayuda a tomar decisiones informadas para mejorar la calidad de la educación. Originalidad: La originalidad se basa en la forma de analizar la información, considerando la información por áreas de conocimiento, así como por continentes. Limitaciones: Ninguna dada la naturaleza de la revisión bibliográfica

    Modelo Acústico y de Lenguaje del Idioma Español para el dialecto Cucuteño, Orientado al Reconocimiento Automático del Habla

    Get PDF
     Context: Automatic speech recognition requires the development of language and acoustic models for different existing dialects. The purpose of this research is the training of an acoustic model, a statistical language model and a grammar language model for the Spanish language, specifically for the dialect of the city of San Jose de Cucuta, Colombia, that can be used in a command control system. Existing models for the Spanish language have problems in the recognition of the fundamental frequency and the spectral content, the accent, pronunciation, tone or simply the language model for Cucuta's dialect.Method: in this project, we used Raspberry Pi B+ embedded system with Raspbian operating system which is a Linux distribution and two open source software, namely CMU-Cambridge Statistical Language Modeling Toolkit from the University of Cambridge and CMU Sphinx from Carnegie Mellon University; these software are based on Hidden Markov Models for the calculation of voice parameters. Besides, we used 1913 recorded audios with the voice of people from San Jose de Cucuta and Norte de Santander department. These audios were used for training and testing the automatic speech recognition system.Results: we obtained a language model that consists of two files, one is the statistical language model (.lm), and the other is the jsgf grammar model (.jsgf). Regarding the acoustic component, two models were trained, one of them with an improved version which had a 100 % accuracy rate in the training results and 83 % accuracy rate in the audio tests for command recognition. Finally, we elaborated a manual for the creation of acoustic and language models with CMU Sphinx software.Conclusions: The number of participants in the training process of the language and acoustic models has a significant influence on the quality of the voice processing of the recognizer. The use of a large dictionary for the training process and a short dictionary with the command words for the implementation is important to get a better response of the automatic speech recognition system. Considering the accuracy rate above 80 % in the voice recognition tests, the proposed models are suitable for applications oriented to the assistance of visual or motion impairment people.  Contexto: El reconocimiento automático del habla requiere el desarrollo de modelos de lenguaje y modelos acústicos para los diferentes dialectos que existen. El objeto de esta investigación es el entrenamiento de un modelo acústico, un modelo de lenguaje estadístico y un modelo de lenguaje gramatical para el idioma español, específicamente para el dialecto de la ciudad de San José de Cúcuta, Colombia, que pueda ser utilizado en un sistema de control por comandos. Lo anterior motivado en las deficiencias que presentan los modelos existentes para el idioma español, para el reconocimiento de la frecuencia fundamental y contenido espectral, el acento, la pronunciación, el tono o simplemente al modelo de lenguaje de la variante dialéctica de esta región.Método: Este proyecto utiliza el sistema embebido Raspberry Pi B+ con el sistema operativo Raspbian que es una distribución de Linux, y los softwares de código abierto CMU-Cambridge Statistical Language Modeling toolkit de la Universidad de Cambridge y CMU Sphinx de la Universidad Carnegie Mellon; los cuales se basan en los modelos ocultos de Markov para el cálculo de los parámetros de voz. Además, se utilizaron 1913 audios grabados por locutores de la ciudad de San José de Cúcuta y el departamento de Norte de Santander para el entrenamiento y las pruebas del sistema de reconocimiento automático del habla.Resultados: Se obtuvo un modelo de lenguaje que consiste de dos archivos, uno de modelo de lenguaje estadístico (. lm), y uno de modelo gramatical (. jsgf). Con relación a la parte acústica se entrenaron dos modelos, uno de ellos con una versión mejorada que obtuvo una tasa de acierto en el reconocimiento de comandos del 100% en los datos de entrenamiento y de 83% en las pruebas de audio. Por último, se elaboró un manual para la creación de los modelos acústicos y de lenguaje con el software CMU Sphinx.  Conclusiones: El número de participantes en el proceso de entrenamiento de los modelos acústicos y de lenguaje influye significativamente en la calidad del procesamiento de voz del reconocedor. Para obtener una mejor respuesta del sistema de Reconocimiento Automático del Habla es importante usar un diccionario largo para la etapa de entrenamiento y un diccionario corto con las palabras de comando para la implementación del sistema. Teniendo en cuenta que en las pruebas de reconocimiento se obtuvo una tasa de éxito mayor al 80% es posible usar los modelos creados en el desarrollo de un sistema de Reconocimiento Automático del Habla para una aplicación orientada a la asistencia de personas con discapacidad visual o incapacidad de movimiento

    WebSockets para lectura rápida de etiquetas RFID de Ultra Alta Frecuencia

    Get PDF
    Las lecturas RFID deben ser obtenidas en el menor tiempo posible. Se presenta el método para lograr lecturas y validaciones, incluyendo el etiquetado, la lógica de programación y el proceso de tomas de datos. En los resultados se presentan características claves de las tecnologías elegidas, y se concluyó que Javascript es el lenguaje de programación ideal debido a su capacidad asíncrona, junto a WebSockets como protocolo de comunicación cumplen con realizar lecturas rápidas

    Comparativa entre la técnica de umbralización binaria y el método de Otsu para la detección de personas

    Get PDF
    In image detection processes where there is a variation in brightness between pixels, techniques are required to obtain optimal and adaptable threshold values for these variations. Therefore, a comparison between the binary thresholding technique and the adaptive method of Otsu is made, in videos with dynamic and static background, weighing the response time of the algorithm, memory used, requirement of the central processing unit and hits in the detections, in the languages of Python and M (Matlab). The techniques in Python present better results in terms of response time and memory space; while, when using Matlab, the lowest percentage of machine requirement is presented. Also, the Otsu method improves the percentage of hits in 12.89 % and 11.3 % for videos with dynamic and static background, with respect to the binary thresholding technique.En procesos de detección por imágenes en las que existe variación de luminosidad entre pixeles, se requieren técnicas que permitan obtener valores óptimos y adaptables de umbral ante dichas variaciones. Por ello, se realiza una comparativa entre la técnica de umbralización binaria y el método adaptativo de Otsu, en videos con fondo dinámico y estático, ponderando el tiempo de respuesta del algoritmo, memoria utilizada, requerimiento de la unidad central de procesos y aciertos en las detecciones, en los lenguajes de Python y M (Matlab). Las técnicas en Python presentan mejores resultados en cuanto a tiempo de respuesta y espacio de memoria; mientras que, al utilizar Matlab, se presenta el menor porcentaje de requerimiento de máquina. Asimismo, el método de Otsu mejora el porcentaje de aciertos en 12.89 % y 11.3 % para videos con fondo dinámico y estático, respecto a la técnica de umbralización binaria

    Efecto de los filtros morfológicos en los procesos de detección de objetos en movimiento

    Get PDF
    En los procesos de sustracción de fondo aplicado a la detección de objetos en movimiento, una de las etapas de mayor relevancia es la del filtrado por morfología, en donde se simplifica la imagen y se conservan la mayor parte de las características de forma de los objetos. Por ello, se realiza una comparativa entre las operaciones de dilatación, erosión, apertura, cierre y gradiente en imágenes de video con fondo estático, donde circulan personas en ambientes no controlados, con el objetivo de determinar su comportamiento en la detección y conteo de personas. El procesamiento de imagen se realiza en lenguaje Python y se utiliza el paquete especializado para visión por computadora OpenCV. Además, mediante Tkinter se desarrolló una interfaz gráfica de usuario con la que se ingresan los valores del tamaño y la forma del elemento estructural para el procesamiento. Al aplicar el filtrado morfológico por dilatación se obtuvo un acierto en las detecciones de 82.28 %, con la erosión el acierto fue de 81.86 %, mientras que, con las operaciones de apertura, cierre y gradiente el acierto fue de 83.69 %, 93.07 % y 87.69 % respectivamente
    corecore