3 research outputs found

    Mathematical modeling and kinematic analysis of 5 degrees of freedom serial link manipulator for online real-time pick and place applications

    Get PDF
    Modeling and kinematic analysis are crucial jobs in robotics that entail identifying the position of the robot’s joints in order to accomplish particular tasks. This article uses an algebraic approach to model the kinematics of a serial link, 5 degrees of freedom (DOF) manipulator. The analytical method is compared to an optimization strategy known as sequential least squares programming (SLSQP). Using an Intel RealSense 3D camera, the colored object is picked up and placed using vision-based technology, and the pixel location of the object is translated into robot coordinates. The LOBOT LX15D serial bus servo controller was used to transmit these coordinates to the robotic arm. Python3 programming language was used throughout the entire analysis. The findings demonstrated that both analytical and optimized inverse kinematic solutions correctly identified colored objects and positioned them in their appropriate goal points

    Substracción de fondo y algoritmo yolo: Dos métodos para la detección de personas en entornos descontrolados

    Get PDF
    Introduction: This article is the result of research entitled “Signal processing system for the detection of people in agglomerations in areas of public space in the city of Cúcuta”, developed at the Universidad Francisco de Paula Santander in 2020.Problem: The high percentage of false positives and false negatives in people detection processes makes decision making in video surveillance, tracking and tracing applications complex. Objective: To determine which technique for the detection of people presents better results in terms of respon-se time and detection hits.Methodology: Two techniques for the detection of people in uncontrolled environments are validated in Python with videos taken inside the Universidad Francisco de Paula Santander: Background subtraction and the YOLO algorithm.Results: With the background subtraction technique, we obtained a hit rate of 84.07 % and an average response time of 0.815 seconds. Likewise, with the YOLO algorithm the hit rate and average response time are 90% and 4.59 seconds respectively.Conclusion: It is possible to infer the use of the background subtraction technique in hardware tools such as the Pi 3B+ Raspberry board for processes in which the analysis of information in real time is prioritized, while the YOLO algorithm presents the characteristics required in the processes in which the information is analyzed after the acquisition of the image.Originality: Through this research, aspects required for the real-time analysis of information obtained in pro-cesses of people detection in uncontrolled environments were analyzed. Limitations: The analyzed videos were taken only at the Universidad Francisco de Paula Santander. Also, the Raspberry Pi 3B+ board overheats when processing the video images, due to the full resource requirement of the device.Introducción: Este artículo es resultado de la investigación titulada “Sistema de procesamiento de señales para la detección de personas en aglomeraciones en zonas de espacio público de la ciudad de Cúcuta”, desarrollada en la Universidad Francisco de Paula Santander en el año 2020.Problema: El alto porcentaje de falsos positivos y falsos negativos en los procesos de detección de personas hace que la toma de decisiones en las aplicaciones de videovigilancia, seguimiento y localización sea compleja. Objetivo: Determinar qué técnica de detección de personas presenta mejores resultados en cuanto a tiempo de respuesta y aciertos en la detección.Metodología: Dos técnicas para la detección de personas en entornos no controlados son validadas en Python con videos tomados dentro de la Universidad Francisco de Paula Santander: la sustracción de fondo y el al-goritmo YOLO.Resultados: Con la técnica de sustracción de fondo se obtuvo una tasa de acierto del 84,07 % y un tiempo de respuesta medio de 0,815 segundos. Asimismo, con el algoritmo YOLO, la tasa de acierto y el tiempo de respuesta promedio son del 90% y 4,59 segundos respectivamente.Conclusión: Es posible inferir el uso de la técnica de sustracción de fondo en herramientas de hardware como la placa Raspberry Pi 3B+ para procesos en los que se prioriza el análisis de la información en tiempo real, mientras que el algoritmo YOLO presenta las características requeridas en los procesos en los que se analiza la información después de la adquisición de la imagen.Originalidad: A través de esta investigación se analizaron los aspectos necesarios para el análisis en tiempo real de la información obtenida en los procesos de detección de personas en ambientes no controlados

    Estruturas de aprendizagem supervisionada para pesquisa multimédia

    Get PDF
    Tal como escrito no título “Estruturas de aprendizagem supervisionada para pesquisa multimédia”. Este trabalho, destina­se à pesquisa e deteção de uma determinada identidade numa sequência de video. É apresentado também como a técnica de aprendizagem profundo por redes neuronais artificiais consegue detetar um personagem através dos vídeos, essa técnica de deteção de um personagem em um vídeo é um campo de estudo muito interessante já pela sua complexidade em múltiplos objetos presentes nos dados em análise, a partir de vídeos de desenhos animados, usamos um banco de dados separado por dois agrupamentos de dados, incluindo o conjunto de quadros que contém a personagem a ser detetada e outro conjunto que não contém a personagem, ou seja, contém outros objetos e entidades que não é a personagem ou pessoa que queremos localizar sua presença. Nesse caso, os rótulos ou etiquetas de formação dos nossos dois estados específicos de frames podem ser ”personagem ausente ou presente” no vídeo, no entanto o 0(zero) representa a ausência da personagem e o 1(um) marcamos sua existência na sequência dos frames do vídeo; isto significa que temos um conjunto de dados brutos de 20h et 20 minutos contendo movimentos rápidos e normal e, todos eles são vídeos de desenhos animados, isto é, o caso­de­uso foi a pesquisa de personagem animadas em videos de desenhos animados, por uma questão de facilidade em arranjar conjuntos de dados. Devemos, a todo custo, reconhecer uma personagem (o nosso caso de uso foi o avatar ”korra”) que imaginamos detetar nas sequências de vídeos usando assim a rede neural convolucional 3D, treinado para a deteção de ações anormais nos vídeos de vigilâncias. O algoritmo de aprendizagem supervisionado permitiu finalmente neste trabalho para a deteção do indivíduo. É uma tarefa difícil que requer a extração de características espaço­temporais significativas para capturar as informações necessárias. A Rede Convolucional 3D (C3D) codifica fluxos de vídeo usando uma rede tridimensional totalmente convolucional e, esta rede gera regiões de temporárias candidatas contendo objetos nas regiões selecionadas para atividades específicas. De seguida, analisaram­se os casos de erro observados, procurando perceber os padrões nos dados que levaram a tais conclusões erradas por parte dos modelos.As it was written in the title ”Supervised learning structures for multimedia research”. This work is aimed at researching and detecting a specific person within the videos. We also present how the technique of deep learning by artificial neural networks can detect a character through videos, this technique of detecting a character in a video is a very interesting field of study because of its complexity in multiple objects present in the data under analysis , from cartoon videos, we used a database separated by two data groups, including the set of frames that contains the character to be detected and another set that does not contain the character, that is, it contains other objects and entities that it is not the character or person that we want to locate your presence. In this case, the formation labels or tags of our two specific frame states can be ”missing or present character” in the video, however 0 (zero) represents the absence of the character and 1 (one) marks its existence in the sequence video frames; this means that we have a set of raw data of 20h and 20 minutes containing fast and normal movements and they are all cartoon videos, that is, the use case was the search for animated characters in cartoon videos, for the sake of ease in arranging data sets. We must, at all costs, recognize a character (in our case it was The avatar korra) that we imagine to detect in the video sequences, thus using the 3D convolutional neural network, trained to detect abnormal actions in the surveillance videos. The supervised learning algorithm finally allowed this work to detect the individual. It is a difficult task that requires the extraction of significant spatiotemporal characteristics to capture the necessary information. The 3D Convolutional Network (C3D) encodes video streams using a fully convolutional three­dimensional network, and this network generates regions of temporary candidates containing objects in the regions selected for specific activities. Finally, we analyzed the error case observed, as an attempt to perceive the data patterns that led the networks to such erroneous conclusions
    corecore