Search CORE

3 research outputs found

Small Object Detection and Tracking: A Comprehensive Review

Author: Derakhshani Reza
Mirzaei Behzad
Nezamabadi-Pour Hossein
Raoof Amir
Publication venue
Publication date: 01/08/2023
Field of study

Object detection and tracking are vital in computer vision and visual surveillance, allowing for the detection, recognition, and subsequent tracking of objects within images or video sequences. These tasks underpin surveillance systems, facilitating automatic video annotation, identification of significant events, and detection of abnormal activities. However, detecting and tracking small objects introduce significant challenges within computer vision due to their subtle appearance and limited distinguishing features, which results in a scarcity of crucial information. This deficit complicates the tracking process, often leading to diminished efficiency and accuracy. To shed light on the intricacies of small object detection and tracking, we undertook a comprehensive review of the existing methods in this area, categorizing them from various perspectives. We also presented an overview of available datasets specifically curated for small object detection and tracking, aiming to inform and benefit future research in this domain. We further delineated the most widely used evaluation metrics for assessing the performance of small object detection and tracking techniques. Finally, we examined the present challenges within this field and discussed prospective future trends. By tackling these issues and leveraging upcoming trends, we aim to push forward the boundaries in small object detection and tracking, thereby augmenting the functionality of surveillance systems and broadening their real-world applicability

Utrecht University Repository

Aprendizaje y corrección de errores en sistemas de seguimiento basados en redes convolucionales siamesas

Author: Iglesias Arias Álvaro
Publication venue
Publication date: 01/06/2021
Field of study

Este Trabajo de Fin de Máster tiene como objetivo el estudio y mejora de los sistemas de seguimiento (trackers) basados en redes neuronales siamesas frente a diferentes problemas clásicos en el seguimiento de objetos (tracking) como pueden ser las oclusiones o los distractores (presencia de objetos idénticos al que se desea seguir en la misma secuencia). Desde la explosión de los sistemas de aprendizaje profundo hace unos años y el aumento en complejidad y tamaño de las bases de datos que esto ha conllevado no hay prácticamente campo de la ingeniería que no se haya visto afectado por estos avances y, sin duda, el campo por excelencia que representa estos cambios ha sido el de la visión artificial o computer vision. Este es un campo grande con gran variedad de aplicaciones distintas, cada una con sus propios desafíos. De entre todas estas aplicaciones una de las más complejas es la del seguimiento de objetos debido a la variedad de situaciones posibles que requieren de sistemas capaces de adaptarse a cualquier situación. Para ello, en este trabajo se han propuesto dos algoritmos basados en seguimiento hacia atrás (o backtracking) e implementados en Matlab con el objetivo de paliar los problemas de los trackers frente a dos problemas concretos; las oclusiones y los distractores. Estos sistemas funcionan como módulos que se pueden añadir sobre la salida de las redes siamesas empleadas para el seguimiento en diferentes trackers y refinan sus predicciones, lo cual hace de estos sistemas especialmente versátiles ya que puede ser empleados en diferentes situaciones y trackers. También, para validar correctamente los resultados obtenidos ha sido necesario generar un dataset propio, a partir de un subconjunto de videos obtenidos de otros datasets, con todos estos problemas etiquetados, tanto a nivel de video como a nivel de frame. Finalmente se han comprobado los diferentes resultados obtenidos en cada una de estas situaciones utilizando el dataset creado y se han analizado las diferentes mejoras, así como los problemas encontrados

Biblos-e Archivo

Sistema de detección de cuchillos y pistolas con los algoritmos YOLOv3-SPP y la iluminación y la difuminación de OpenCV

Author: Quito Gonzales Ernesto Edgar
Publication venue: 'Universidad Cesar Vallejo'
Publication date: 01/01/2023
Field of study

El problema de la investigación fue ¿Cuál fue el efecto del sistema de detección de cuchillos y pistolas con los algoritmos YOLOv3-spp y la iluminación y la difuminación de OpenCV? El objetivo de la investigación fue determinar el efecto del sistema de detección de cuchillos y pistolas con los algoritmos YOLOv3-spp y la iluminación y la difuminación de OpenCV. El diseño de investigación fue preexperimental y la metodología ágil utilizada fue Scrum. La muestra por conveniencia estuvo conformada por 2083 imágenes de cuchillos y 1327 imágenes de pistolas. La sensibilidad del 94.2% fue menor al 100% logrado por Olmos et al. (2017), porque usaron un conjunto de datos guiados por el clasificador VGG-16. La especificad del 89.4% fue menor al 95% logrado por Elsner et al. (2019) porque utilizaron un detector de 2-Pass (2 pasadas) totalmente convolucionada en regiones (R-FCN) con un extractor de características ResNet-101. La precisión del 94.2% de esta investigación fue superior al 44.28% obtenido por Fernandez Carrobles et al. (2019) porque se usó imágenes tratadas con iluminación, difuminación y una capa Spatial Pyramid Pooling (He et al., 2015). La exactitud del 88% fue menor al 97% de Arceda et al. (2016) porque usaron un detector de escenas violentas, un algoritmo de normalización y un detector de rostros. El tiempo promedio de entrenamiento de 2.07 s se mantuvo dentro de los mejores porque se usó una instancia con Intel(R) Xeon(R) CPU @ 2.30GHz, 12.7 GB RAM y Tesla T4 15 GB GPU similar a Nguyen et al. (2020) con Intel (R) Xeon (R) Gold 6152 CPU @ 2.10 GHz, GPU Tesla P100 con el algoritmo YOLOv3. El tiempo promedio de entrenamiento de 26.19 ms fue rápido porque se utilizó YOLOv3-spp, que aparte de usar Darknet53, adiciona una capa llamada Spatial Pyramid Pooling, similar a Nguyen et al. (2020), quienes usaron YOLOv3 con Darknet53. Se recomienda utilizar más algoritmos de aumento de datos como rotación, acercar y alejar, así como aumentar el conjunto de datos de entrenamiento e interactuar con los hiperparámetros

Repositorio Institucional Universidad César Vallejo: Página de inicio