unknown

大規模データの視覚解析に関する研究

Abstract

様々な問題の解決のため,大量かつ複雑な情報の解析が専門家により広く行われている.例えば,ネットワークセキュリティにはネットワーク監視,実験科学には機器分析がある.このような解析において,人間の判断を必要とする大規模データの解析には,視覚化手法を利用した解析方法である視覚解析(Visual Analytics)の利用が進んでいる.しかし,現在の視覚解析を専門家が利用するにはいくつかの問題がある.専門家が求めるレベルの詳細な情報の提示をしていないか,詳細な視覚表現はあるが概要を示す視覚表現が少ない.本論文では,専門家向けの大規模データの視覚解析の要求事項をまとめ,視覚解析システムの作成と実運用による事例研究について述べた.視覚化にはInformation Visualization とScientific Visualization の二種類の分野があり,それぞれ異なる領域を対象に適用されてきた.それぞれの対象領域の専門家から視覚解析システムに対する要求獲得を行い,その結果,どちらにも共通の要求が存在することが分かった.それは,数百万件規模の大量の情報を扱えること,全体から詳細まで見えること,複数情報の関係が見えること,情報の絞り込みが出来ること,オリジナルデータの情報を確認できることである.これらを満たすため,三次元表示による概略表示,二次元表示による詳細表示,テキスト表示によるオリジナルデータの表示と,その統合表示が重要であることを述べた.この考え方を基にそれぞれの分野の適用対象であるネットワーク監視と機器分析に対して視覚解析システムを作成した.それぞれのシステムは専門家により運用され,実データの解析を通して有効性を確認した.Information Visualization を利用した視覚解析には,ネットワークセキュリティにおける内部ネットワーク監視がある.内部ネットワーク監視では,数MB から数百MB にも及ぶ侵入検知システムのログから誤検知したインシデントを除外するために内部ネットワークに置かれた計算機の種類の情報やIP アドレスの地理的な割り当ての情報から総合的に判断する.この解析作業を支援するため,内部ネットワーク監視で重要な論理・時間・地理情報を三次元空間内に統合的に視覚化する監視システム「IchiLAN」を開発した.各情報を三次元空間に適切に配置することで,個々の情報を把握しつつ互いの関係をも把握できる.また,厖大なセキュリティログの視覚化時に起こる表示の複雑さを軽減するために様々なフィルタリング機能を有し,概要から詳細へと解析を誘導する.更に絞り込まれた情報の元々のログと同じ情報を文字表示により詳細に表示する.本システムを実際の内部ネットワークで運用し,従来手法では見落とされていたインシデントの発見や,効率的な監視・運用が可能となることを示した.Scientific Visualization を利用した視覚解析には,質量分析における繰り返し構造を持つ物質の解析がある.脂質やポリマーのように繰り返し構造を持つ物質の解析では質量分析が利用され,数十万点から数百万点にも及ぶデータポイントから成るマススペクトルから末端基等の修飾,繰り返し数,強度分布など,複数の情報に基づいた総合的な判断を必要とされる.そこで,質量分析における繰り返し構造の視覚解析システム「mzRepeat」を開発した.時間と強度の二次元情報であるマススペクトルを分割して並べることで,繰り返し構造の数を示す軸を追加した三次元情報として解析できる.また,視覚的に解析しやすい二次元表示を用意し,着目したピークの詳細やピーク間の詳細情報を表示する.本システムを実際のマススペクトルの解析に使用し,従来手法より迅速簡便に同定・分析できることを示した.どちらの事例においても,従来手法では確認できなかった問題の発見や,従来よりも高速な解析を可能にした.また,上記の事例研究の結果より,大規模データの視覚解析に共通する要求に対して考察した.大規模データを扱う上では様々な場面においてGPU の活用が有用であった.二次元表示と三次元表示のアニメーションによる統合表示は複数情報の関係を示すだけで無く,focus+context (全体と詳細の表示) を実現し,情報の関係を見落とす事無く画面を切り替えられた.テキスト表示による詳細表示が示すオリジナルデータの情報が分析者が求める情報を示した.本論文ではネットワークセキュリティの解析例と質量分析の解析例を述べたが,他の専門家向けの視覚解析においても獲得した共通の要求を考慮し,本研究の手法の適用により迅速簡便な視覚解析が期待できる.電気通信大学201

    Similar works