block and memory based part of speech tagging

戴国忠; 石晶

block and memory based part of speech tagging

Authors: 戴国忠
石晶
Publication date: 1 January 2006
Publisher

Abstract

基于组块及记忆的模型(BMM)采用与传统方法明显不同的标注思路,以汉语中的整句为处理单元,从组块出发,立足于单个词汇,分析更为丰富的上下文语境知识,并借助知网词典记忆词性集合,同时采用渐增式的机械学习方式获取参数值。对于棘手的稀疏数据问题只简单地设置平伏常数加以平滑,最后利用少量人工规则修正标注结果。实验表明,该模型的封闭式测试准确率将近99%,开放式测试准确率为95%以上

Similar works

Full text

Available Versions

Institute Of Software, Chinese Academy Of Sciences

oai:ir.iscas.ac.cn:311060/2220

Last time updated on 30/12/2017