3 research outputs found
Small Object Detection and Tracking: A Comprehensive Review
Object detection and tracking are vital in computer vision and visual surveillance, allowing for the detection, recognition, and subsequent tracking of objects within images or video sequences. These tasks underpin surveillance systems, facilitating automatic video annotation, identification of significant events, and detection of abnormal activities. However, detecting and tracking small objects introduce significant challenges within computer vision due to their subtle appearance and limited distinguishing features, which results in a scarcity of crucial information. This deficit complicates the tracking process, often leading to diminished efficiency and accuracy. To shed light on the intricacies of small object detection and tracking, we undertook a comprehensive review of the existing methods in this area, categorizing them from various perspectives. We also presented an overview of available datasets specifically curated for small object detection and tracking, aiming to inform and benefit future research in this domain. We further delineated the most widely used evaluation metrics for assessing the performance of small object detection and tracking techniques. Finally, we examined the present challenges within this field and discussed prospective future trends. By tackling these issues and leveraging upcoming trends, we aim to push forward the boundaries in small object detection and tracking, thereby augmenting the functionality of surveillance systems and broadening their real-world applicability
Aprendizaje y correcci贸n de errores en sistemas de seguimiento basados en redes convolucionales siamesas
Este Trabajo de Fin de M谩ster tiene como objetivo el estudio y mejora de los sistemas de
seguimiento (trackers) basados en redes neuronales siamesas frente a diferentes problemas
cl谩sicos en el seguimiento de objetos (tracking) como pueden ser las oclusiones o los
distractores (presencia de objetos id茅nticos al que se desea seguir en la misma secuencia).
Desde la explosi贸n de los sistemas de aprendizaje profundo hace unos a帽os y el aumento en
complejidad y tama帽o de las bases de datos que esto ha conllevado no hay pr谩cticamente
campo de la ingenier铆a que no se haya visto afectado por estos avances y, sin duda, el campo
por excelencia que representa estos cambios ha sido el de la visi贸n artificial o computer vision.
Este es un campo grande con gran variedad de aplicaciones distintas, cada una con sus propios
desaf铆os. De entre todas estas aplicaciones una de las m谩s complejas es la del seguimiento de
objetos debido a la variedad de situaciones posibles que requieren de sistemas capaces de
adaptarse a cualquier situaci贸n.
Para ello, en este trabajo se han propuesto dos algoritmos basados en seguimiento hacia atr谩s
(o backtracking) e implementados en Matlab con el objetivo de paliar los problemas de los
trackers frente a dos problemas concretos; las oclusiones y los distractores. Estos sistemas
funcionan como m贸dulos que se pueden a帽adir sobre la salida de las redes siamesas empleadas
para el seguimiento en diferentes trackers y refinan sus predicciones, lo cual hace de estos
sistemas especialmente vers谩tiles ya que puede ser empleados en diferentes situaciones y
trackers.
Tambi茅n, para validar correctamente los resultados obtenidos ha sido necesario generar un
dataset propio, a partir de un subconjunto de videos obtenidos de otros datasets, con todos
estos problemas etiquetados, tanto a nivel de video como a nivel de frame.
Finalmente se han comprobado los diferentes resultados obtenidos en cada una de estas
situaciones utilizando el dataset creado y se han analizado las diferentes mejoras, as铆 como los
problemas encontrados
Sistema de detecci贸n de cuchillos y pistolas con los algoritmos YOLOv3-SPP y la iluminaci贸n y la difuminaci贸n de OpenCV
El problema de la investigaci贸n fue 驴Cu谩l fue el efecto del sistema de detecci贸n
de cuchillos y pistolas con los algoritmos YOLOv3-spp y la iluminaci贸n y la
difuminaci贸n de OpenCV? El objetivo de la investigaci贸n fue determinar el efecto
del sistema de detecci贸n de cuchillos y pistolas con los algoritmos YOLOv3-spp
y la iluminaci贸n y la difuminaci贸n de OpenCV. El dise帽o de investigaci贸n fue preexperimental
y la metodolog铆a 谩gil utilizada fue Scrum. La muestra por
conveniencia estuvo conformada por 2083 im谩genes de cuchillos y 1327
im谩genes de pistolas.
La sensibilidad del 94.2% fue menor al 100% logrado por Olmos et al.
(2017), porque usaron un conjunto de datos guiados por el clasificador VGG-16.
La especificad del 89.4% fue menor al 95% logrado por Elsner et al. (2019)
porque utilizaron un detector de 2-Pass (2 pasadas) totalmente convolucionada
en regiones (R-FCN) con un extractor de caracter铆sticas ResNet-101. La
precisi贸n del 94.2% de esta investigaci贸n fue superior al 44.28% obtenido por
Fernandez Carrobles et al. (2019) porque se us贸 im谩genes tratadas con
iluminaci贸n, difuminaci贸n y una capa Spatial Pyramid Pooling (He et al., 2015).
La exactitud del 88% fue menor al 97% de Arceda et al. (2016) porque usaron
un detector de escenas violentas, un algoritmo de normalizaci贸n y un detector
de rostros.
El tiempo promedio de entrenamiento de 2.07 s se mantuvo dentro de los
mejores porque se us贸 una instancia con Intel(R) Xeon(R) CPU @ 2.30GHz, 12.7
GB RAM y Tesla T4 15 GB GPU similar a Nguyen et al. (2020) con Intel (R) Xeon
(R) Gold 6152 CPU @ 2.10 GHz, GPU Tesla P100 con el algoritmo YOLOv3. El
tiempo promedio de entrenamiento de 26.19 ms fue r谩pido porque se utiliz贸
YOLOv3-spp, que aparte de usar Darknet53, adiciona una capa llamada Spatial
Pyramid Pooling, similar a Nguyen et al. (2020), quienes usaron YOLOv3 con
Darknet53. Se recomienda utilizar m谩s algoritmos de aumento de datos como
rotaci贸n, acercar y alejar, as铆 como aumentar el conjunto de datos de
entrenamiento e interactuar con los hiperpar谩metros