基于统计抽词和格律的全宋词切分语料库建立

周昌乐; 李翼鸿; 苏劲松

unknown

基于统计抽词和格律的全宋词切分语料库建立

Authors: 周昌乐
李翼鸿
苏劲松
Publication date: 1 March 2007
Publisher: 中文信息学报

Abstract

全宋词切分语料库的建立是计算机研究宋词的基础。本文对宋词中“词”的界定提出了自己的看法,并在综合考虑统计抽词方法和基于诗词格律切分方法各自优点的基础上,提出建立全宋词切分语料库的新方法。我们首先通过统计抽词来抽取结合程度较强的二字词,并结合相关资源建立词表;在此基础上,结合宋词的格律特点按照一定的规则来对全宋词进行了切分。实验证明,本文中的方法具有较好的效果。国家自然科学基金资助项目(60373080

Similar works

Full text

Open in the Core reader

Download PDF

Available Versions

Xiamen University Institutional Repository

oai:dspace.xmu.edu.cn:2288/827...

Last time updated on 16/06/2016