自己学習型トピッククローラーの構築と評価

Abstract

Web上の情報量は、個人が必要とする情報量をはるかに上回っている。利用者の情報収集を支援する、GoogleやYahoo等の汎用的な検索エンジンが開発されている。しかし汎用的な検索エンジンでは、特定の分野について網羅的に収集し、情報をまとめるといった要求には応えられない。著者らは、特定分野のWeb ページ収集を効率的に行なうトピッククローラーの研究開発を行なっている。トピッククローラーでは、トピックに関するページの判定精度も必要であるが、トピックページへ早く辿りつく速度も重要である。著者らは、One man & his dogシステムと呼ぶトピック判定とリンク選出戦略機能を連携させるシステムを試作した。また、2つのトピックについての収集実験を行い本論文の手法の効率性を調査した

    Similar works