17 research outputs found

    Research on Automatic Acquisition and Preprocessing Methods of Domain Ontology Learning Corpus

    Get PDF
    [目的/意义]实现领域语料的自动获取与预处理,为机器/深度学习驱动的领域本体自动构建提供数据及数据处理技术基础。[方法/过程]首先,对所涉及语料的类型、获取方法及应用研究现状进行分析,提出多源异构领域语料的自动获取方法,包括基于Web Spider的网络开放领域语料和基于Web API的科学文献领域语料的自动获取等。其次,分析提出领域基础知识词典的自动构建方法,为语料预处理奠定基础。最后,通过对主流分词方法及开源分词工具进行测试与评估,提出基于增量训练HanLP-SP领域分词模型的多策略混合的自动分词与新词发现方法,并进行实验研究。[结果/结论]方法能够有效获取到领域语料,并实现分词等预处理任务。</p

    Study on the Interaction of Gliotoxin with BSA

    Get PDF
    应用荧光、圆二色和紫外—可见吸收等波谱法研究胶毒素与牛血清白蛋白(bSA)的相互作用。荧光光谱实验结果表明胶毒素主要靠疏水作用与bSA结合,而对其内源荧光产生猝灭作用,其淬灭方式为静态猝灭,胶毒素与bSA的结合常数为7.2x103l/MOl。圆二色光谱检测发现,随着胶毒素浓度的增加,bSA的α-螺旋数量也增加,当胶毒素浓度为bSA浓度的100倍时,bSA的α-螺旋增加40.1%,表明胶毒素与bSA的结合改变了bSA的空间构象。The interaction between Gliotoxin and bovine serum albumin (BSA) was studied by the fluo-rescence, Circular Dichroism (CD) and ultraviolet visible (UV-Vis) techniques.The fluorescent experiment showed that the intrinsic fluorescence of BSA was quenched by the binding of gliotoxin in a static quenching procedure, with an association constant of 7.2×103 L/mol and in hydropobic forces.And the CD spectrum revealed that gliotoxin effected the conformation of BSA by increased the mass of α-helix.国家863计划项目(No.2006AA09Z410

    基于模式和投影学习的领域概念上下位关系自动识别研究

    No full text
    [目的]实现对领域概念上下位关系的自动识别,以解决领域本体自动化构建中领域概念间语义关系的自动获取和确立问题。[方法]将传统无监督的基于模式的方法和当前先进的有监督的基于投影学习的方法有机结合起来应用于领域概念上下位关系自动识别,并进行了试验研究。[结果]能识别出领域概念的上位词集合,在医学领域的识别精度为0.88,通用领域的识别精度为0.83,在评估基准集BLESS上的平均精度为0.85。[局限]受句法歧义、语料集的质量等影响,模型精度尚未达到峰值,存在错误识别的情况。[结论]可发现同一概念词的不同意义的上位词,对低频词和命名实体也具有较好识别效果。未来可考虑从对高频顶层上位词进行适当减权、提升有监督语料集的质量等方面进行优化。&nbsp;</p

    基于BERT的领域本体分类关系自动识别研究

    No full text
    【目的/意义】实现对领域本体分类关系的自动学习识别,解决领域本体知识框架结构体系的自动化构建问题。【方法/过程】通过对领域本体分类关系自动识别的国内外研究现状及存在问题进行分析总结,以当前开源的先进的深度学习文本预训练模型BERT为基础,研究构建了基于BERT的领域本体分类关系自动识别模型,并以资源环境学科领域为例进行了实验研究和评估分析。【结果/结论】模型能够实现对领域本体分类关系的自动识别,识别方法和流程具有极大地通用性和可移植性,识别精度比传统方法有了较大提升。但由于受分类标注语料的质量限制,模型精度尚未达到峰值,有待进一步优化提升。</p

    Method of Domain Ontology Concept Automatic Extraction Based on Deep Learning

    No full text
    [目的/意义]实现对领域概念的自动学习抽取,解决领域本体自动化构建的首要基础任务。[方法/过程]以无监督的学习方法和端到端的识别模式为理论技术基础,首先通过对主流词嵌入模型进行对比分析,设计提出了基于Word2Vec和Skip-Gram的领域文本特征词嵌入模型的自动生成方法;其次研究构建了以IOB格式的标注文本作为输入,基于自注意力机制的BLSTM-CRF领域概念自动抽取模型;最后以资源环境学科领域为例进行了实验研究与评估分析。[结果/结论]模型能够实现对领域概念的自动抽取,对领域新概念或术语的自动识别也具有一定的健壮性。[局限]模型精度尚未达到峰值,有待进一步优化提升。&nbsp;</p

    基于自然语言处理和机器学习的实体关系抽取方法研究

    No full text
    实现非结构化文本中实体关系的有效抽取,并形成一条简单化、易操作、可重复的实现路径,为图书情报等相关领域分析处理与整合利用网络非结构化数字资源提供方法基础。充分结合自然语言处理与机器学习方法的优势:首先,通过词性标注、句法分析等多种自然语言处理方法实现对非结构化文本数据的语义化处理与特征提取,使其转变为机器学习模型可以接收的输入;其次,采用远程监督和设计决策程序的方式将得到的初始化特征进一步转换为机器学习模型可以使用的一组规则化标签;最后,指定预测变量,训练机器学习模型,使其能够使用预先生成的标签数据进行学习和推理,并推断出实体关系的边际概率。能够使用预先给定的领域知识提高非结构化文本中实体关系抽取的精度和质量,并有效解决一定的统计推断问题。暂未能在一些专业领域进行验证,有待引入和开发可扩展的高性能学习和推理引擎,以支持更多的基础机器学习算法的快速运行。&nbsp;</p

    RAPID IDENTIFICATION of BIFIDOBACTERIA BY RAPD

    No full text
    本文应用rAPd技术,选用11种引物,以嗜酸乳杆菌为对照,对6种13珠双歧杆菌菌株基因组dnA进行PCr扩增,分析其dnA指纹图谱,并计算其相似性指数。结果表明,双歧杆菌和非双歧杆菌之间,其相似性指数有显著差异;选择合适的引物进行扩增,双歧杆菌不同种间和同种不同株间可表现不同的dnA指纹图谱。本文还对rAPd技术应用于双歧杆菌分类鉴定的可能性进行讨论。11 random primers were chosen to ampliFy the aegomic DNA From 13 strains belonged to 6 species of BiFidobacteria.Lactobacillus acidophillus and Escheichia coli were used as control.AFter analysing DNA Fingerprinting pattems and calculating similarity index(Sl),we Found that the diFFerence of Sl between BiFidobacteria and non-BiFidobacteria was signiFicant and that diFFerent species or strains BiFidobacteria showed diFFerent DNA Fingerprinting patters using appropriate random primers.The possibility of using RAPD For BiFidobacteria idenFiFcation qas discussed

    非对称取代脲的合成与应用

    No full text
    总结了合成非对称取代脲的几种方法,分析了各种方法的利弊,介绍了非对称取代脲的主要应用,指出直接利用一氧化碳进行硒催化的胺与硝基化合物的氧化还原羰基化反应来合成非对称取代脲的方法是比较有发展前景的方法,并对硒催化的氧化还原羰基化反应作了较为详细的介绍

    The Population Fluctuation and Bioactivity of Endophytic Fungi from Mangrove Plants in Different Seasons

    No full text
    2003年10月至2004年8月对福建龙海浮宫2种红树植物秋茄、木榄的内生真菌进行连续6次的分离,得到290株内生真菌.研究结果显示,木榄(Bruguiera gymnorrhiza)和秋茄(Kandelia candel)内生真菌数量高峰期分别为4月份和10~12月份;青霉(Penicillium)、交链孢(Alternaria)、Dothiorella和无孢目是秋茄中的主要优势属;木榄内生真菌主要优势属为头孢霉(Cephalosporium)、交链孢(Alternaria)、青霉(Penicillium)等.不同宿主对内生真菌的季节分布有重要的影响.抗菌测定共筛选得到活性菌株40株,占总菌株数的13.8%;17株内生真菌对KB(人口腔上皮癌)和/或Raji(人B淋巴瘤)细胞具有抑制作用,占总菌株数的5.9%.生物活性菌株分布于青霉、交链孢、拟青霉、无孢目等10个不同的分类单元中,2种宿主植物内生真菌抗菌及抗肿瘤活性均有不同程度的季节差异性.From December 2003 to August 2004,the endophytic fungi of Kandelia cande and Bruguiera gymnorrhiza,which were collected from Fugong in Fujian Province,were isolated for six times.290 strains endophytic fungi were obtained.The results showed the number fastigium of endophytic fungi from Kandelia candel and Bruguiera gymnorrhiza were in April and October to December respectively.Penicillium?Alternaria?Dothiorell and the nonsporulating groups were the dominant genuses of the endophytic fungi from Kandelia cande,while the endophytic fungi from Bruguiera gymnorrhiza mainly belonged to Cephalosporium?Alternaria?Penicillium,and so on.The differences of the host played an important role in the attribution of the temporal variations of different endophytic fungi.In the investigation of antimicrobial activities,40 strains(13.8% of the total isolates) with antimicrobial activities were screened out.17 strains(5.9% of the total isolates) could inhibit the growth of Raji and/or KB tumor cell lines.The active strains obtained mostly belonged to Penicillium,Alternaria,Paecilomyces and other 7 genuses.The endophytic fungi from 2 mangrove plants also displayed seasonal variations in their antimicrobial and antitumor activities.国家863计划(2003AA624010);; 福建省科技计划项目(2004N003)资
    corecore