トライ コウゾウ オ モチイタ キョウキ ジョウホウ ノ コウリツテキ キオク ケンサクホウ ニ カンスル ケンキュウ

Abstract

本論文は,自然言語辞書に構築される基本語彙の関係を定義することで無限に作り出され る共起情報の効率的な記憶検索技法に関する研究の成果をまとめたものであり,以下の7章 により構成される. 第1章では,緒論として,自然言語処理システムにおける共起情報の利用の歴史的背景 を述べると共に,本研究の目的ならびにその工学上の意義を述べることで,本研究の意義及 び位置付けを明確にする. 第2章では,共起情報の概要と意義について説明する.また,自然言語処理システムにお ける辞書の意義についても述べ,辞書を構成する基木的なアルゴリズムについて説明する. 第3章では,辞書の構成法として最も適しているトライ構造について概要を述べ,その 検索,更新アルゴリズムについて説明する. 第4章では,トライ構造を実装するためのデータ構造について説明し,最も効率的な手 法であるダブル配列法について,検索,更新アルゴリズムとともに詳細に述べる.また,ダ ブル配列法の問題点であるキー追加の速度を改善する手法として,ダブル配列で構築された 辞書を変更することなく高速化する手法と,ダブル配列に格納した情報を利用して高速化を 実現する手法を提案する. 第5章では,共起情報を効率的に記憶検索する手法として,関連研究とともに提案手法 であるリンクトライについて述べ,リンクトライにおいて定義されるリンク情報により,冗 長性を排除した効率的な記憶が可能となることを示し,同時に提案した構造における共起情 報の検索,更新アルゴリズムを説明する.また,ダブル配列を用いたリンクトライのデータ 構造についても説明しリンクトライのデータ構造を提案する上で考案された,複数の辞書 を1つのダブル配列で管理する手法も述べる. 第6章では,提案手法に対して検索速度,記憶効率の理論的評価,及び実験による評価 を与え,本手法の有効性を確かめ,考察を加える. 第7章では,本研究で得られた諸成果の総括を行い,今後の研究課題について述べる

    Similar works