3 research outputs found

    Small Object Detection and Tracking: A Comprehensive Review

    Get PDF
    Object detection and tracking are vital in computer vision and visual surveillance, allowing for the detection, recognition, and subsequent tracking of objects within images or video sequences. These tasks underpin surveillance systems, facilitating automatic video annotation, identification of significant events, and detection of abnormal activities. However, detecting and tracking small objects introduce significant challenges within computer vision due to their subtle appearance and limited distinguishing features, which results in a scarcity of crucial information. This deficit complicates the tracking process, often leading to diminished efficiency and accuracy. To shed light on the intricacies of small object detection and tracking, we undertook a comprehensive review of the existing methods in this area, categorizing them from various perspectives. We also presented an overview of available datasets specifically curated for small object detection and tracking, aiming to inform and benefit future research in this domain. We further delineated the most widely used evaluation metrics for assessing the performance of small object detection and tracking techniques. Finally, we examined the present challenges within this field and discussed prospective future trends. By tackling these issues and leveraging upcoming trends, we aim to push forward the boundaries in small object detection and tracking, thereby augmenting the functionality of surveillance systems and broadening their real-world applicability

    Aprendizaje y correcci贸n de errores en sistemas de seguimiento basados en redes convolucionales siamesas

    Full text link
    Este Trabajo de Fin de M谩ster tiene como objetivo el estudio y mejora de los sistemas de seguimiento (trackers) basados en redes neuronales siamesas frente a diferentes problemas cl谩sicos en el seguimiento de objetos (tracking) como pueden ser las oclusiones o los distractores (presencia de objetos id茅nticos al que se desea seguir en la misma secuencia). Desde la explosi贸n de los sistemas de aprendizaje profundo hace unos a帽os y el aumento en complejidad y tama帽o de las bases de datos que esto ha conllevado no hay pr谩cticamente campo de la ingenier铆a que no se haya visto afectado por estos avances y, sin duda, el campo por excelencia que representa estos cambios ha sido el de la visi贸n artificial o computer vision. Este es un campo grande con gran variedad de aplicaciones distintas, cada una con sus propios desaf铆os. De entre todas estas aplicaciones una de las m谩s complejas es la del seguimiento de objetos debido a la variedad de situaciones posibles que requieren de sistemas capaces de adaptarse a cualquier situaci贸n. Para ello, en este trabajo se han propuesto dos algoritmos basados en seguimiento hacia atr谩s (o backtracking) e implementados en Matlab con el objetivo de paliar los problemas de los trackers frente a dos problemas concretos; las oclusiones y los distractores. Estos sistemas funcionan como m贸dulos que se pueden a帽adir sobre la salida de las redes siamesas empleadas para el seguimiento en diferentes trackers y refinan sus predicciones, lo cual hace de estos sistemas especialmente vers谩tiles ya que puede ser empleados en diferentes situaciones y trackers. Tambi茅n, para validar correctamente los resultados obtenidos ha sido necesario generar un dataset propio, a partir de un subconjunto de videos obtenidos de otros datasets, con todos estos problemas etiquetados, tanto a nivel de video como a nivel de frame. Finalmente se han comprobado los diferentes resultados obtenidos en cada una de estas situaciones utilizando el dataset creado y se han analizado las diferentes mejoras, as铆 como los problemas encontrados

    Sistema de detecci贸n de cuchillos y pistolas con los algoritmos YOLOv3-SPP y la iluminaci贸n y la difuminaci贸n de OpenCV

    Get PDF
    El problema de la investigaci贸n fue 驴Cu谩l fue el efecto del sistema de detecci贸n de cuchillos y pistolas con los algoritmos YOLOv3-spp y la iluminaci贸n y la difuminaci贸n de OpenCV? El objetivo de la investigaci贸n fue determinar el efecto del sistema de detecci贸n de cuchillos y pistolas con los algoritmos YOLOv3-spp y la iluminaci贸n y la difuminaci贸n de OpenCV. El dise帽o de investigaci贸n fue preexperimental y la metodolog铆a 谩gil utilizada fue Scrum. La muestra por conveniencia estuvo conformada por 2083 im谩genes de cuchillos y 1327 im谩genes de pistolas. La sensibilidad del 94.2% fue menor al 100% logrado por Olmos et al. (2017), porque usaron un conjunto de datos guiados por el clasificador VGG-16. La especificad del 89.4% fue menor al 95% logrado por Elsner et al. (2019) porque utilizaron un detector de 2-Pass (2 pasadas) totalmente convolucionada en regiones (R-FCN) con un extractor de caracter铆sticas ResNet-101. La precisi贸n del 94.2% de esta investigaci贸n fue superior al 44.28% obtenido por Fernandez Carrobles et al. (2019) porque se us贸 im谩genes tratadas con iluminaci贸n, difuminaci贸n y una capa Spatial Pyramid Pooling (He et al., 2015). La exactitud del 88% fue menor al 97% de Arceda et al. (2016) porque usaron un detector de escenas violentas, un algoritmo de normalizaci贸n y un detector de rostros. El tiempo promedio de entrenamiento de 2.07 s se mantuvo dentro de los mejores porque se us贸 una instancia con Intel(R) Xeon(R) CPU @ 2.30GHz, 12.7 GB RAM y Tesla T4 15 GB GPU similar a Nguyen et al. (2020) con Intel (R) Xeon (R) Gold 6152 CPU @ 2.10 GHz, GPU Tesla P100 con el algoritmo YOLOv3. El tiempo promedio de entrenamiento de 26.19 ms fue r谩pido porque se utiliz贸 YOLOv3-spp, que aparte de usar Darknet53, adiciona una capa llamada Spatial Pyramid Pooling, similar a Nguyen et al. (2020), quienes usaron YOLOv3 con Darknet53. Se recomienda utilizar m谩s algoritmos de aumento de datos como rotaci贸n, acercar y alejar, as铆 como aumentar el conjunto de datos de entrenamiento e interactuar con los hiperpar谩metros
    corecore