research

マルチ最小サポートを用いて継続時間と時間間隔を考慮した時系列パターンマイニングアルゴリズムの研究

Abstract

近年蓄積された膨大なデータから潜在的に価値のある情報を見つけ出す時系列パターンマイニング技術が様々の分野で注目され,研究が進められてきた.時系列パターンマイニングによってイベントの発生順序を示すパターンが抽出されるが,イベントの継続時間とイベント間の時間間隔は考慮されて来なかった.そこで,本研究ではイベントの継続時間と時間間隔を考慮した時系列パターンを抽出する手法を検討する.時系列パターンを抽出するには継続時間と時間間隔を離散化してアイテムにしなければならない.継続時間はイベントごとに,時間間隔はイベント間ごとに分布や範囲が異なるため,時間を適切に分割することが困難である.そこで,本研究ではそれぞれイベントの継続時間とイベント間の時間間隔を階層に分類することによって,マルチレベルで継続時間と時間間隔を考慮した時系列パターンを抽出する.また,階層で上位レベルのパターンの出現頻度は下位レベルのパターンの出現頻度を合わせた値となるため,上位レベルのパターンの出現頻度が下位レベルのパターンの出現頻度より高くなる傾向があることを考慮する.階層レベル毎に異なる最小サポートを設定するマルチ最小サポートを用いて頻出する時系列パターンを抽出する二つのアルゴリズムDI-PrefixSPMとDI-SufPrefixSPMを提案する.DI-PrefixSPMはイベントの出現順序のみを考慮した時系列パターンを抽出するPrefixSpanアルゴリズムを単純に拡張したアルゴリズムである.DI-PrefixSPMにより継続時間と時間間隔を考慮した時系列パターンを抽出することが可能になるが,最下位レベルに対応する最小サポートだけを用いて枝刈りするため,実行中に多数の不要なパターンが計算されることで処理効率が低下する問題がある.DI-SufPrefixSPMは長さ2 の頻出パターンをベースパターンとして,そのパターンのレベルに対応する最小サポートでパターンを前後に伸ばすことによって頻出パターンを抽出する.DI-SufPrefixSPMはマルチ最小サポートを用いてパターンの長さ毎の枝刈りを実現し,不要なパターンの計算を回避できる.前後両方向にパターンを伸ばすため,マルチ最小サポートにおける各レベル間の最小サポートの値の差がとても小さく,枝刈りの効果が少なくなる時に処理性能が低下する場合がある.実験により,マルチ最小サポートの設定によるが,長さ毎に枝刈りを可能としたDI-SufPrefixSPMはDI-PrefixSPMより優れていることを確認した.電気通信大学201

    Similar works