6 research outputs found

    基于实例的汉语语义超常搭配的自动发现

    Get PDF
    搭配在语言信息处理中具有重要的应用价值,通常我们主要关注符合语法规则的常规搭配。实际上,语言中还存在着大量的语法上符合规则而语义上不符合常规认知的语义超常搭配现象,而这样的现象与语言的隐喻表达和思维有着密切的联系,对自然语言理解将产生重要的影响。本文面向汉语隐喻理解来研究文本中语义超常搭配的自动发现方法,从汉语语义超常搭配判断的心理机制出发,提出了基于实例的汉语语义超常搭配识别的量化计算方法。实验以动词为中心的搭配语料为测试集,语义超常搭配识别的召回率为80. 7 % ,准确率为81. 5 %。实验结果表明本文所给出的基于实例语义超常搭配判断的办法是切实可行的。国家自然科学基金资助(项目号:60373080) 和浙江大学985 工程资

    基于多元判别分析的汉语句群自动划分方法

    Get PDF
    针对目前句群划分工作缺乏计算语言学数据支持、忽略篇章衔接词的问题以及当前篇章分析较少研究句群语法单位的现象,提出一种汉语句群自动划分方法。该方法以汉语句群理论为指导,构建汉语句群划分标注评测语料,并且基于多元判别分析(MDA)方法设计了一组评价函数J,从而实现汉语句群的自动划分。实验结果表明,引入切分片段长度因素和篇章衔接词因素可以改善句群划分性能,并且利用Skip-Gram Model比传统的向量空间模型(VSM)有更好的效果,其正确分割率Pμ达到85.37%、错误分割率Window Diff降到24.08%。同时该方法在句群划分任务上有更大的优势,比传统MDA方法有更好的句群划分效果。国家自然科学基金资助项目(61202281,61103101);教育部人文社会科学研究项目青年基金资助项目(10YJCZH052,12YJCZH201

    Computational Models for Metaphor Comprehension:a Survey

    Get PDF
    国际上,隐喻在思维及语言中所处的中心地位正逐渐引起人工智能研究者的重视。但在国内学术界,还鲜有开展隐喻计算化这方面研究的;实际上,作为异常用法的隐喻现象是自然语言中的普遍情况,因此隐喻问题若得不到很好的解决,将成为制约自然语言理解和机器翻译的瓶颈问题。本文结合相关的隐喻理论基础,根据不同的计算路线对已有隐喻理解计算模型进行分类,包括基于语义优先方法、基于知识表示的方法、基于逻辑的方法和基于统计语料库的方法,并在分析这些方法的适用范围和优缺点的基础上,对隐喻的计算理解方法以及面向汉语的隐喻理解计算模型研究提出了展望和建议。Metaphor is prevalent in natural language. Researchers have realized that it is the focus of mind and language mechanism. The comprehension of metaphor by machine will be a bottle-neck problem in natural language understanding and machine translation. In this paper, current available computational models for metaphor comprehension are reviewed. According to their computational methods, the models are divided into preference semantics based, metaphorical knowledge based, logic based, and corpus based approaches. The advantage and limitation of each model are also analyzed. At last, prospect and advice to computational model for metaphor comprehension are proposed. As a conclusion, the research of computational model for Chinese metaphors is important for Chinese information processing.国家自然科学基金资助项目(60373080

    中国石松类和蕨类植物的多样性与地理分布

    No full text
    物种编目及其科属系统排列是了解生物多样性的基础,本文采用Flora of China使用的分类系统,结合最新分子分类学研究成果以及近几年发表的新资料,对中国石松类和蕨类植物多样性和地理分布数据进行了统计和分析。结果表明中国共有石松类和蕨类植物40科178属2,147种5个亚种118个变种,其中特有种839个,占总种数的39.08%。种数最多的5个科依次为鳞毛蕨科(505种,含种下单位,下同)、蹄盖蕨科(323种)、水龙骨科(280种)、凤尾蕨科(266种)和金星蕨科(209种);种数最多的5个属依次为耳蕨属(Polystichum,209种)、鳞毛蕨属(Dryopteris,176种)、蹄盖蕨属(Athyrium,137种)、双盖蕨属(Diplazium,98种)和凤尾蕨属(Pteris,97种)。在地理分布上,种数排名前5的省份为云南(1,365种)、四川(875种)、贵州(838种)、广西(785种)和台湾(779种)。含中国特有石松类和蕨类植物的科属中,排前3位的科分别为鳞毛蕨科(257种)、蹄盖蕨科(169种)和凤尾蕨科(113种);排前3位的属为耳蕨属(140种)、蹄盖蕨属(82种)和鳞毛蕨属(61种)

    Computational Model of Metaphor and its Application in Metaphorical Classification

    No full text
    隐喻理解是语篇理解中的难点,也是认知科学研究中的热点。本文针对汉语中普遍存在隐喻的现象,从计算的角度,首先提出了一套汉语句子形式化方法,并在此基础上针对隐喻的特点构建出隐喻语义网络计算模型。为了阐述隐喻网络模型的应用,文章后半部分提出了一套基于隐喻网络模型的隐喻分类体系,并对其合理性以及实用性进行了分析,为后续的隐喻自动识别以及隐喻理解奠定了基础。Metaphor is a difficult problem in natural language understanding, while it is also a hot topic in the cogni- tive scientific research. Aiming at the generally existent phenomenon of metaphor in Chinese, in term of computing [from the aspect of computing], this paper proposes a set of methods of formalizing Chinese sentence at first, and structures the computational model of metaphorical semantic network (MSN) according to the characteristics of metaphor. Then, we apply the MSN to metaphorical classification, present a systematic method of metaphorical clas- sification, this lays a foundation for the later research in auto metaphorical classification and metaphorical understand- ing.国家自然科学基金(项目编号:60373080);; 福建省自然科学基金(项目编号:A0210005)
    corecore