Method of Domain Ontology Concept Automatic Extraction Based on Deep Learning

刘巍; 杨恒; 王思丽; 祝忠明

Method of Domain Ontology Concept Automatic Extraction Based on Deep Learning

Authors: 刘巍
杨恒
王思丽
祝忠明
Publication date: 28 October 2019
Publisher

Abstract

[目的/意义]实现对领域概念的自动学习抽取，解决领域本体自动化构建的首要基础任务。[方法/过程]以无监督的学习方法和端到端的识别模式为理论技术基础，首先通过对主流词嵌入模型进行对比分析，设计提出了基于Word2Vec和Skip-Gram的领域文本特征词嵌入模型的自动生成方法；其次研究构建了以IOB格式的标注文本作为输入，基于自注意力机制的BLSTM-CRF领域概念自动抽取模型；最后以资源环境学科领域为例进行了实验研究与评估分析。[结果/结论]模型能够实现对领域概念的自动抽取，对领域新概念或术语的自动识别也具有一定的健壮性。[局限]模型精度尚未达到峰值，有待进一步优化提升。 </p

Similar works

Full text

Available Versions

National Science Library,Chinese Academy of Sciences

oai:ir.las.ac.cn:12502/10532

Last time updated on 18/12/2019