unknown

基于语义空间的支持向量机的文本过滤

Abstract

传统的基于支持向量机的文本过滤,用向量空间模型来表示文本和用户模板,向量空间 模型假设特征项之间是线性无关的,该假设引入了许多因具体用词变化不定而带来的词汇噪音信息, 影响了基于支持向量机的文本过滤的过滤性能。提出基于语义空间的支持向量机的文本过滤,用语 义来表示文本和用户模板。该方法主要通过奇异值分解提取文本的潜在语义空间,在语义空间上训 练支持向量机得到用户模板和过滤阈值,文本流上的文本映射到语义空间上,在语义空间上计算用户 模板和新文本的相似度。实验表明:该方法的过滤性能可以达到98. 67%。福建省科技计划重点资助项目(001J005

    Similar works