Generalization of Window Construction for Subsequence Matching in Time - Series Databases

Abstract

본 논문에서는 서브시퀀스 매칭에서 윈도우 구성의 일반화 개념을 제안하고, 이에 기반한 새로운 서브시퀀스 매칭 방법인 GeneralMatch를 제안한다. 기존 연구인 Faloutsos 등의 방법 (간단히 FRM이라 한다)은 점 여과 효과의 결여로 인해 많은 착오해답을 발생시켰다. 본 저자들의 DualMatch는 점 여과 효과를 발휘하여 성능을 크게 향상시켰으나, 주어진 최소 질의 시퀀스 길이에 대해 최대 윈도우 크기가 작은(FRM의 1/2) 문제가 있었다. GeneralMatch는 DualMatch를 더욱 개섢나 방법으로서, 두 바업ㅂ의 장점을 모두 취한다. 즉, FRM과 같이 큰 윈도우를 사용할 수 있으며, 동시에 DualMatch와 같이 점 여과 효과를 발휘할 수 있다. GeneralMatch는 데이터 시퀀스를 J-슬라이딩 윈도우(일반화된 슬라이딩 윈도우)로 나누고, 질의 시퀀스를 J-디스조인트 윈도우(일반화된 디스조인트 윈도우)로 나누는 방법을 사용한다. 본 논문에서는 GeneralMatch의 정확성, 즉, GeneralMatch가 착오기각이 발생하지 않음을 증명한다. 또한, 주어진 최소 질의 시퀀스 길이에 대해 GeneralMatch가 바르게 동작하기 위한 최대 윈도우 크기가 있음을 증명한다. 그리고, 페이지 액세스 횟수를 최소로 하는 J 값의 결정 방법을 제안한다. 실제 주식 데이터에 대한 실험 결과, GeneralMatch는 낮은 선택률 범위(10^(-6)~10^(-4))에서 DualMatch에 비해 평균 114%, FRM에 비해 평균 998% 성능을 향상시켰으며, 높은 선택률 범위(10^(-3)~10^(-1))에서도 DualMatch에 비해 평균 46%, FRM에 비해 평균 65% 성능을 향상시켰다.2

    Similar works

    Full text

    thumbnail-image

    Available Versions