5 research outputs found

    Bus line trajectories classification using weightless neural networks

    Get PDF
    Geo-enabled devices are ubiquitous nowadays. Within a diversity of possible applications using the huge of amount data generated by this technology, our work focuses on a chronic problem of Rio de Janeiro city: its public bus system. This text presents a framework for GPS trajectories classification, whose focus is the identification of bus routes of a public bus system. In order to do that, it was used the lightweight and versatile WiSARD, a weightless neural network classifier. Different binarization methods were used to adapt raw data to WiSARD’s binary input, making use of a set of rules defined by the application domain. Yet, it is evaluated a way of combining WiSARD through decision directed acyclic graphs. All these approachs result in different flavors of a neuro-symbolic learning system. The framework was tested against a vast data set created from open access and real-time data acquired from the current bus system of Rio de Janeiro city. Results obtained suggest the applicability of the proposed solution in a classification problem with more than 500 classes. Comparisons made also indicate an equivalent performance of WiSARD and other state-of-art and widely used machine learning methods. In addition, the framework described here is believed to be adaptable to other application domains.Dispositivos com localização espacial estão em toda parte hoje em dia. Dentre várias possíveis aplicações com a grande quantidade de dados gerada por esse tipo de equipamento, nosso trabalho foca em um problema crônico da cidade do Rio de Janeiro: seu sistema público de ônibus. Apresenta-se neste texto uma arquitetura para classificação de trajetórias GPS, cujo foco é a identificação de rotas de ônibus do sistema público. Para isso, utilizamos o leve e versátil classificador baseado em redes neurais sem peso WiSARD. Para a geração da entrada da rede, experimentamos diferentes formas de binarização, fazendo uso de regras definidas pelo problema. Ainda, avaliamos uma forma de combinação das redes WiSARD com o uso de um grafo acíclico de decisões. Todas essas propostas resultam em diferentes sabores de um sistema de aprendizado neurossimbólico. Tal arquitetura foi testada contra um vasto conjunto de dados construído a partir de dados fornecido em tempo real e de forma pública pelo sistema corrente da cidade do Rio de Janeiro. Os resultados obtidos indicam a aplicabilidade da solução proposta em um problema de classificação envolvendo mais de 500 classes. As comparações efetuadas indicam uma equiparação do modelo WiSARD com outros modelos em estado da arte. No mais, acreditamos que a metodologia aqui descrita possa ser utilizada com sucesso em outros domínios

    Towards optimization methods for movelets extraction in multiple aspect trajectory classification

    Get PDF
    Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2023.In the last few years there has been a significant increase in the collection of mobility data. By mobility data we refer to the collection of positioning data, called trajectories, of tracked moving objects. These objects could be humans, animals, vehicles or other devices like Internet of Things (IoT). The analysis of such data has been proved to be useful in several application domains from a urban scenario for traffic prediction or transportation means optimization, to maritime domain analysing vessels paths or environmental domain with the study of hurricanes evolution or animal behavior. One of the most typical and used analysis task on mobility data is classification, where trajectory data is automatically assigned a label or class. The explosion of social media data, sensors, IoT, and Internet-enabled sources allowed the semantic enrichment of such mobility data, which evolved from raw spatio-temporal data to high dimensional data. Mobility analysis, and specifically classification task, on such high dimensional data becomes therefore more challenging. In fact, existing trajectory classification methods have mainly considered space, time, and numerical data, ignoring the large number of semantic dimensions. Only recently research community proposed classification methods based on the concept of movelets that are the parts of a trajectory that better discriminate a class and that can therefore improve classification accuracy. State of the art methods in movelets extraction are computationally inefficient, which makes them unfeasible to be used for real large high dimensional datasets. The objective of this thesis is therefore to develop new algorithms for discovering movelets that are faster than state of the art while maintaining or improving classification accuracy. Our main contribution is a new high performance method for extracting movelets and classifying trajectories, called HiPerMovelets (High-performance Movelets). Experimental results show that HiPerMovelets is 10 times faster than the best state of the art method, reduces the high dimensionality problem, is more scalable, and presents a high classification accuracy in all evaluated datasets. A secondary contribution are the algorithms RandomMovelets and UltraMovelets. RandomMovelets reduces the search space by randomly extracting subtrajectories and evaluating their relevance for classification without exploring the entire dataset. UltraMovelets reduces the combinatorial explosion when exploring subtrajectories. Preliminary results suggest that these methods can reduce the search space, use less computational resources, and are at least 6 times faster than baselines.Nos últimos anos, houve um aumento significativo na coleta de dados de mobilidade. Dados de mobilidade referem-se ao conjunto de dados de posicionamento geográfico, chamados de trajetórias de objetos móveis. Esses objetos podem ser pessoas, animais, veículos ou outros dispositivos como a Internet das Coisas (IoT). A análise deste tipo de dados se revela útil em vários domínios de aplicação, desde um cenário urbano para previsão de tráfego ou otimização de meios de transporte, no domínio marítimo analisando trajetos de embarcações, no domínio ambiental com o estudo da evolução de furacões ou comportamento animal. Uma das tarefas de análise mais comuns e usadas em dados de mobilidade é a classificação, onde os dados de trajetória recebem automaticamente um rótulo ou classe. A explosão de dados de mídia social, sensores, IoT e outras fontes da Internet permitiram o enriquecimento semântico desses dados de mobilidade, que evoluíram de dados espaço-temporais brutos para dados de alta dimensionalidade. A análise de mobilidade, e especificamente a tarefa de classificação, em tais dados de alta dimensionalidade tem se tornado mais desafiadora. De fato, os métodos de classificação de trajetória existentes consideram principalmente espaço, tempo e dados numéricos, ignorando o grande número de dimensões semânticas. Apenas recentemente a comunidade de pesquisa propôs métodos de classificação baseados no conceito de movelets que são as partes de uma trajetória que melhor discriminam uma classe e que podem, portanto, melhorar a precisão da classificação. Métodos de última geração na extração de movelets são computacionalmente ineficientes, o que os torna inviáveis para serem usados em grandes conjuntos de dados de alta dimensão. O objetivo desta tese é, portanto, desenvolver novos algoritmos para descobrir movelets que sejam mais rápidos do que o estado da arte, mantendo ou melhorando a precisão da classificação. Nossa principal contribuição é um novo método de alto desempenho para extração de movelets e classificação de trajetórias, denominado HiPerMovelets (Movelets de alto desempenho). Os resultados experimentais mostram que o HiPerMovelets é 10 vezes mais rápido que o melhor método do estado da arte, reduz o problema de alta dimensionalidade, é mais escalável e apresenta uma alta precisão de classificação em todos os conjuntos de dados avaliados. Uma contribuição secundária são os algoritmos RandomMovelets e UltraMovelets. RandomMovelets reduz o espaço de busca extraindo subtrajetórias aleatoriamente e avaliando sua relevância para classificação sem explorar todo o conjunto de dados. UltraMovelets reduz a explosão combinatória ao explorar subtrajetórias. Os resultados preliminares sugerem que esses métodos podem reduzir o espaço de busca, usar menos recursos computacionais e são pelo menos 6 vezes mais rápidos que a linha de base

    Incorporating duration information for trajectory classification

    No full text
    10.1109/ICDE.2012.72Proceedings - International Conference on Data Engineering1132-114
    corecore