10 research outputs found

    A Comparison Between Alignment and Integral Based Kernels for Vessel Trajectories

    Get PDF
    In this paper we present a comparison between two important types of similarity measures for moving object trajectories for machine learning from vessel movement data. These similarities are compared in the tasks of clustering, classication and outlier detection. The rst similarity type are alignment measures, such as dynamic time warping and edit distance. The second type are based on the integral over time between two trajectories. Following earlier work we dene these measures in the context of kernel methods, which provide state-of-the-art, robust algorithms for the tasks studied. Furthermore, we include the in uence of applying piecewise linear segmentation as pre-processing to the vessel trajectories when computing alignment measures, since this has been shown to give a positive eect in computation time and performance. In our experiments the alignment based measures show the best performance. Regular versions of edit distance give the best performance in clustering and classication, whereas the softmax variant of dynamic time warping works best in outlier detection. Moreover, piecewise linear segmentation has a positive eect on alignments, which seems to be due to the fact salient points in a trajectory, especially important in clustering and outlier detection, are highlighted by the segmentation and have a large in uence in the alignments

    The Influence of Global Constraints on Similarity Measures for Time-Series Databases

    Full text link
    A time series consists of a series of values or events obtained over repeated measurements in time. Analysis of time series represents and important tool in many application areas, such as stock market analysis, process and quality control, observation of natural phenomena, medical treatments, etc. A vital component in many types of time-series analysis is the choice of an appropriate distance/similarity measure. Numerous measures have been proposed to date, with the most successful ones based on dynamic programming. Being of quadratic time complexity, however, global constraints are often employed to limit the search space in the matrix during the dynamic programming procedure, in order to speed up computation. Furthermore, it has been reported that such constrained measures can also achieve better accuracy. In this paper, we investigate two representative time-series distance/similarity measures based on dynamic programming, Dynamic Time Warping (DTW) and Longest Common Subsequence (LCS), and the effects of global constraints on them. Through extensive experiments on a large number of time-series data sets, we demonstrate how global constrains can significantly reduce the computation time of DTW and LCS. We also show that, if the constraint parameter is tight enough (less than 10-15% of time-series length), the constrained measure becomes significantly different from its unconstrained counterpart, in the sense of producing qualitatively different 1-nearest neighbor graphs. This observation explains the potential for accuracy gains when using constrained measures, highlighting the need for careful tuning of constraint parameters in order to achieve a good trade-off between speed and accuracy

    Pesquisa de eventos geográficos semelhantes: trajectórias de objectos em movimento

    Get PDF
    Dissertação para obtenção do Grau de Mestre em Engenharia InformáticaNos dias de hoje rara e a pessoa que não possui um aparelho de Geo-Posicionamento por Satelite(GPS), esteja este no seu automóvel ou no seu bolso, visto que os componentes necessários para o seu correcto funcionamento são agora adquiridos a um preço bastante convidativo. Devido à existência de um enorme volume de dados georreferenciados, sendo alguns deles referentes a movimentações de pessoas e/ou eventos ambientais/sociais, tais como furacões,migrações, tráfego, transportes, tornou-se necessário descobrir e aperfeiçoar processos que agilizem o tratamento eficaz e eficiente de pesquisas por semelhança neste tipo de dados de modo a se poder prever/analisar possíveis catástrofes, assim como ajudar na tomada de decisões referente a estrategias. Neste trabalho foi realizada uma avaliação das tecnicas existentes na pesquisa por semelhança de eventos geográficos, nomeadamente trajectórias. Para tal foi realizado um estudo de todas as tecnicas existentes que estão envolvidas neste tipo de pesquisa, em particular as funções de semelhança e os metodos de indexação mais relevantes utilizados nesta área de investigação. Foi realizada uma avaliação das pesquisas por semelhança em diferentes espaços metricos de trajectórias com as estruturas de dados metricas Recursive Lists of Clusters 2 (RLC2) e Metric-Tree (M-Tree). Com base nesta avaliação, foi proposto um mecanismo de indexação para armazenamento de trajectórias que agiliza a pesquisa dos k mais semelhantes num espaço metrico de trajectórias, denominado SimTraj

    Técnicas de agrupamento de trajetórias com aplicação à recomendação de percursos

    Get PDF
    Mestrado em Engenharia de Computadores e TelemáticaO uso generalizado de dispositivos capazes de obter e transmitir dados sobre a localização de objetos ao longo do tempo tem permitido recolher grandes volumes de dados espácio-temporais. Por isso, tem-se assistido a uma procura crescente de técnicas e ferramentas para a análise de grandes volumes de dados espácio-temporais com o intuito de disponibilizar uma gama variada de serviços baseados na localização. Esta dissertação centra-se no desenvolvimento de um sistema para recomendaSr trajetos com base em dados históricos sobre a localização de objetos móveis ao longo do tempo. O principal problema estudado neste trabalho consiste no agrupamento de trajetórias e na extração de informação a partir dos grupos de trajetórias. Este estudo, não se restringe a dados provenientes apenas de veículos, podendo ser aplicado a outros tipos de trajetórias, por exemplo, percursos realizados por pessoas a pé ou de bicicleta. O agrupamento baseia-se numa medida de similaridade. A extração de informação consiste em criar uma trajetória representativa para cada grupo de trajetórias. As trajetórias representativas podem ser visualizadas usando uma aplicação web, sendo também possível configurar cada módulo do sistema com parâmetros desejáveis, na sua maioria distâncias limiares. Por fim, são apresentados casos de teste para avaliar o desempenho global do sistema desenvolvido.The widespread use of devices to capture and transmit data about the location of objects over time allows collecting large volumes of spatio-temporal data. Consequently, there has been in recent years a growing demand for tools and techniques to analyze large volumes of spatio-temporal data aiming at providing a wide range of location-based services. This dissertation focuses on the development of a system for recommendation of trajectories based on historical data about the location of moving objects over time. The main issues covered in this work are trajectory clustering and extracting information from trajectory clusters. This study is not restricted to data from vehicles and can also be applied to other kinds of trajectories, for example, the movement of runners or bikes. The clustering is based on a similarity measure. The information extraction consists in creating a representative trajectory for the trajectories clusters. Finally, representative trajectories are displayed using a web application and it is also possible to configure each system module with desired parameters, mostly distance thresholds. Finally, case studies are presented to evaluate the developed system

    User Behavior Reasoning and Next Location Prediction Based on Life Log Mining

    Get PDF
    학위논문 (박사)-- 서울대학교 대학원 : 산업공학과, 2016. 2. 박종헌.최근 스마트폰과 태블릿과 같은 스마트 모바일 기기들의 급속한 보급으로 인해 개인 별로 하나 이상의 모바일 기기를 휴대하고 다니는 것이 일상적인 상황이 되었다. 이에 따라 웹서핑이나 메시징, 게임 등의 기능들을 활용하는 것이 자연스러운 상황이 되었으며, 해당 기기로부터 획득 가능한 개인 일상에 대한 직·간접 정보를 활 용하는 라이프 로그 마이닝 연구가 주목 받게 되었다. 라이프 로그로부터 사용자의 행위를 추론하고 목적지를 예측 하는 연구는 라이프 로그 마이닝 연구의 분야들 중 하나로 실제 생활에 밀접한 관련이 있고 지능형 서비스를 제공하는 기반이 된다는 점에서 중요성과 활용성이 높은 연구들이다. 하지만 스마트 기기가 주변 환경 정보나 과거 방문 기록 등과 같은 간접 정보만 획득 가능하다는 점과 개인의 행위와 목적지는 관측 가능한 요인 이외의 외부적인 요인의 영향을 미칠 수 있다는 점에서 이를 주어진 정보로부터 추론하는 데에 어려움이 존재한다. 본 연구에서는 위의 문제 점을 고려하여 라이프 로그로부터 사용자의 행위와 목적지를 추론 하는 방법에 대한 연구를 수행한다. 일련의 연구를 수행을 위해서는 라이프 로그를 수집할 수 있는 환경의 구축이 선행되어야 한다. 기존 라이프 로그 연구들은 연구들 각각에 대해 라이프 로그 수집 환경을 개별적으로 구축하고 수입하는 경우가 다수였다. 다양한 연구들의 요구사항에 따라 유연 하게 설정 가능한 플랫폼을 구축을 통해 다양한 라이프 로그 연구 에 기반으로써 신속하게 연구를 진행할 수 있는 기반을 제공한다. 라이프 로그 연구에서 공간적 정보의 적절한 획득 및 활용은 중요한 요소 중 하나이다. 라이프 로그에서는 GPS 센서와 같은 장비를 통해 위치 정보를 물리적인 위치를 나타내는 좌표의 형태로 획득되지만, 본 연구에서 수행하는 사용자 행위 추론 연구나 목적지 예측 연구 등과 같이 사용자의 움직임이나 상태를 추론하는 연구에서는 물리적인 위치에서 더 나아가 해당 위치가 어떤 장소인지를 인지하고 활용하는 것이 중요하다. 본 연구에서는 이를 위해 라이프 로그로부터 획득한 불규칙적인 위치 좌표 정보로부터 응용의 관점에서 적합한 중요 장소들을 추출하는 클러스터링 기반 알고리즘을 제안 한다. 사용자 행위 추론은 위에서 소개한 라이프 로그 수집 플랫폼 상에서 실험을 수행하고 제안한 장소 추출 방법론을 통해 장소를 획 득한 후 이를 바탕으로 사용자 행위를 추론하는 방법론을 제안한다. 사용자가 일상 생활에서 수행하는 다양한 고차원 행위들에 대해 실 생활에서 획득한 라이프 로그 및 태깅된 행위 정보를 기반으로 추론하는 방법론을 제시한다. 사용자가 방문할 다음 목적지 예측을 실제적 상황에서 수행하기 위해 라이프 로그로부터 패턴을 획득하고 이를 바탕으로 사용자의 라이프 로그를 새로운 형태로의 맵핑을 통해 목적지를 예측하는 방법론을 제시한다. 제시한 방법론은 생활 공간에서의 목적지 예측 문제를 풀고자 한 것으로 사용자의 실제 생활에 밀접한 세세한 레벨 에서의 목적지 예측을 수행하였으며 기존 방법론 대비 개선된 성능을 보임을 확인하였다.1. 서론 1 1.1. 연구의 배경 및 목적 1 1.2. 연구의 범위 및 구성 5 2. 관련 연구 7 2.1. 라이프 로그 수집 플랫폼 7 2.2. 중요 장소 추출 연구 10 2.3. 행위 추론 연구 13 2.4. 목적지 예측 연구 17 3. 라이프 로그 마이닝 플랫폼 19 3.1. 플랫폼 소개 및 특징 21 3.2. 플랫폼 관련 고려 사항 29 3.2.1. 데이터 수집 관련 이슈 29 3.2.2. 기기 사용성 관련 이슈 30 3.2.3. 개인정보 보호 및 보안 32 4. 중요 장소 추출 알고리즘 34 4.1. 문제 정의 34 4.2. 제안 기법 38 4.2.1. 사용자 위치 데이터 40 4.2.2. 정지 위치 인지 41 4.2.3. 관측 장소 추출 47 4.2.4. 실제 장소 추출 52 4.3. 실험 및 실험 결과 56 4.3.1. 실험 데이터 56 4.3.2. 실험 환경 설정 56 4.3.3. 실험 결과 59 5. 행위 추론 63 5.1. 문제 정의 63 5.2. 데이터 수집 및 분석 65 5.3. 기존 방법론 적용 테스트 81 5.4. 제안 방법론 84 5.5. 실험 결과 87 6. 목적지 예측 91 6.1. 문제 정의 91 6.2. 제안 방법 94 6.2.1. ST 경로 생성 95 6.2.2. STP 패턴 추출 97 6.2.3. STP 경로 구성 102 6.2.4. 갭 시퀀스 마이닝 105 6.2.5. 목적지 예측 106 6.3. 실험 및 실험 결과 110 7. 결론 및 향후 연구 방향 117 7.1. 결론 117 7.2. 향후 연구 방향 119 참고 문헌 121 Abstract 132Docto

    Coping with distance and location dependencies in spatial, temporal and uncertain data

    Get PDF
    corecore