2 research outputs found

    Evaluación comparativa de algoritmos de detección de personas en secuencias de vídeo

    Full text link
    El incremento de datos que se recogen a diario no cesa de multiplicarse y se calcula que, para el año 2020, la cantidad anual de datos recogida será de unas 40 veces la actual. Además, el 80% del total de los nuevos datos será información no estructurada como datos multimedia (que representan el 70% de esta información)1 lo que permite comprender la importancia de su análisis. Este hecho hace que cada vez sea más importante disponer de herramientas que procesen esos datos para ofrecer los resultados deseados sin tener que analizar personalmente los mismos. Por ello, son cada vez más los investigadores que desarrollan técnicas y algoritmos para realizar el tratamiento de datos multimedia y específicamente de vídeo. Una de las tareas más complejas y a la vez más útiles es la detección de personas por su aplicabilidad en el día a día. Su utilización en el ámbito de la seguridad, de la asistencia a la conducción, para la realización de resúmenes e indexación de vídeos entre otras, la han convertido en una de las principales áreas de investigación en el análisis de vídeo. Debido a ello, en la actualidad, existen gran cantidad de algoritmos de detección de personas evaluados con sus propios dataset y diferentes métricas para su evaluación. Este Proyecto Fin de Carrera tiene como objetivo principal realizar una evaluación comparativa de diferentes algoritmos de detección de personas del estado del arte ante un dataset común. De esta forma evaluaremos uniformemente los algoritmos más representativos y sobre un entorno no específico y muy variado que pueda dar una evaluación fiable de los mismos así como optimizar las configuraciones de cada uno de los algoritmos modificando sus parámetros. Por ello, en primer lugar se hará un estudio del estado del arte en cuanto a la detección de personas, se analizarán las fases críticas y se escogerán los algoritmos más representativos de las diferentes opciones de las fases críticas. Se estudiarán individualmente, a continuación se ejecutarán con sus parámetros iniciales fijados por el autor. Tras esto se estudiarán los parámetros de cada algoritmo y se buscarán aquellos que puedan tener una influencia en su rendimiento ante un dataset “neutral”. Una vez seleccionados se compararán los resultados para cada algoritmo y a continuación entre ellos con sus configuraciones óptimas y de mejor media para el dataset en su conjunto. Para esto, se realiza una evaluación de cada algoritmo sobre el dataset propuesto con diferentes configuraciones. En primer lugar con la configuración por defecto del autor para comparar los resultados originales propuestos, tras esto ejecutaremos cada algoritmo con todas las configuraciones de sus parámetros escogidas, en tercer lugar la configuración de parámetros óptima de entre los elegido por cada vídeo y en cuarto lugar la que ofrezca la mejor media para el conjunto del dataset en general para cada algoritmo.The volume of daily collected data continues to increase and it is estimated that by 2020, the annual amount of data collected will grow to 40 times the existing amount. 80% of all new data will be unstructured and multimedia data, which makes up 70% of this information1, allows us to understand the importance of information analysis more easily. Therefore, this makes it increasingly important to have the tools that process the data more efficiently to provide the desired results, without having to personally analyse them. There are more and more researchers developing techniques and algorithms for processing multimedia data and specifically more video based multimedia. One of the most useful and complex tasks is detecting people’s applicability from day to day in a simultaneous manner. One of the main areas of research in video analysis (in the area of safety driving assistance) is abstracting and indexing video. As a result, there are many people detection algorithms being evaluated on their dataset and their different metrics. This PFC's main objective is to target different algorithms for state of the art People Detection technology to a common dataset. As a result, accurately evaluating the most reliable algorithms in a specific environment and varying them so that they can perform a reliable assessment. In optimising the settings of each of the parameters and therefore changing each algorithms will give additional results. Furthermore, a study will be made of the current state of the art technology regarding the detection of people and critical phases will be analyzed. The most representative algorithms of different options will be chosen in critical phase and studied individually, and run with initial parameters, set by the author. After that, the parameters of each algorithm will be examined and those that may have an influence on their performance to a "neutral" dataset, will be searched. A selected time is given for each individual algorithm and then together with their best average result for the whole dataset and after that, the configurations are compared. For this, an assessment of each of the proposed algorithm with different configurations dataset is performed. First with the default settings of the author (to compare the original results) and after that we run each algorithm with all configurations of parameters chosen. Secondly a setting of optimal parameters between each video elected is performed. Finally, the result which gives the best average for the entire dataset in general for each algorithm

    PDbm: People detection benchmark repository

    Full text link
    This paper is a postprint of a paper submitted to and accepted for publication in Electronics Letters and is subject to Institution of Engineering and Technology Copyright. The copy of record is available at IET Digital Library and IEEE XploreFollowing the approach of the change detection challenge, in order to facilitate the evaluation of new algorithms for people detection, a people detection benchmarking repository is presented. It includes realistic sequences, people detection ground truth and an evaluation framework. It will be updated based on received feedback, and will maintain a comprehensive ranking of submitted methods for years to come
    corecore