A Lexical-chain Based Filtering Model And Application

Abstract

随着因特网的迅猛发展,大量的信息朝着人们扑面而来,如何才能得到用户真正需求的信息已成为越来越突出的问题。对文本进行过滤是人们经常采用的一种文本管理方法。 本文提出了一个基于词汇链的自然语言文本自动过滤模型,该模型以《WordNet》为主要的概念关系知识源,把文本中的词按照关系组成词汇链的形式,来表示文本内容,从而利用文本的这些词汇链进行文本过滤。该模型概述如下:文本过滤系统分为训练模块和过滤模块;不论是训练集中的文本还是测试集中的文本,我们都对其中的关键词间的关系进行分类,并按照某种关系将文本的关键词集聚起来形成词汇链以表示文本。系统开始工作后,首先利用训练集提供的文本进行学习,逐步精确到用...With the rapid growth of Internet, lots of information surges toward us. It has been an urgent problem on how to manage all the information we have gotten. Text Filtering(TF) is an important method which is been generally used to deal with this problem by people. This paper presents a new automatic natural language text fitering module based on lexical chain. This module uses WordNet as the main...学位:工学硕士院系专业:计算机与信息工程学院计算机科学系_计算机应用技术学号:20002800

    Similar works