汉字结构的统计分析

Abstract

以小学语文课本的三千个印刷体汉字作统计材料,每个字划分为四个象限,把在左上角象限、右下角象限的笔划构成的形状分别统计,形状相同或类似的归为一类并称之为子模式。统计结果表明,左上角的子模式组字能力比右下角的强。但左上角子模式的形状较复杂,除构成子模式的部首的笔划外,总带有其它笔划。右下角子模式的形状较简单,除它本身的笔划外,无其它笔划。两者比较,在设计汉字多步自动识别的系统时,以右下角的子模式作初分类的依据,比较有利。</p

    Similar works