33 research outputs found

    基于学术产出挖掘的用户兴趣建模研究

    Get PDF
    个性化服务实现的核心在于用户建模&mdash;&mdash;建立用户兴趣、目标和行为的数据结构。用户模型所包含信息的丰富程度,决定个性化服务的可靠准确程度和水平。数字图书馆的用户大多为科研人员,他们的学术产出也是当前数字图书馆的重要资源。学术产出不仅包含了科研人员的领域背景和研究方向,也隐含了关于科研人员研究兴趣的信息。 本研究选择地学领域为目标领域,以Web of Science文献数据库为学术产出的数据来源,从中采集了若干科研人员的学术产出数据,并对其中蕴含的兴趣信息进行梳理和分析。然后在复用用户本体FOAF、兴趣本体WI、地学本体SWEET等已有本体的基础上,设计了基于本体的用户兴趣模型,建立了学术产出到用户兴趣模型的映射关系。其中作者、机构、期刊等元数据,直接作为兴趣项,对于标题、摘要等非结构化的数据,采用了开源文本挖掘工具GATE进行实体识别和关系抽取,并将得到的实体关系对作为兴趣项。在分析兴趣度的各种影响因素的基础上,对各兴趣项的兴趣度进行计算。最后将生成的用户兴趣实例存储到Sesame本体数据库中,支持通过SeRQL和SPARQL语言进行查询。 本研究以科研用户公开发表的学术产出为数据源,首先避免了用户兴趣建模初期存在的冷启动问题;然后采用本体技术进行用户兴趣建模,并提出一种通过实体关系对表示用户兴趣的方法,与使用单个关键词或实体的表示方法相比,语义信息更为丰富,能更好的描述用户兴趣;最后实现了用户兴趣信息的语义化存储和检索,为以后实现基于本体的个性化服务打下基础。</p

    面向地学领域的自动语义标注研究

    Get PDF
    如何实现对大量信息资源的自动语义标注是建设基于语义网的数字图书馆的关键问题之一。本文以地学领域的专业文档为标注对象,基于地球科学术语语义网SWEET和文本工程通用框架GATE实现自动语义标注,并提出了一种依据领域本体中属性的定义域和值域映射RDF三元组的方法,实验结果验证方法的有效性

    1978~2008年中国湿地类型变化

    Get PDF
    分别基于美国陆地卫星(Landsat MSS/TM/ETM+)和中巴资源卫星(CBERS-02B)影像数据,以人工目视解译为主,完成了中国1978~2008年4期(基准年分别为1978,1990,2000和2008年)湿地遥感制图,并进行了大量的室内外验证.在此基础上,对我国湿地现状及近30年来湿地变化进行了初步分析,得到以下主要结论:(ⅰ)截止2008年,中国湿地面积约为324097km2,其中以内陆沼泽(35%)和湖泊湿地(26%)为主.(ⅱ)1978~2008年,中国湿地面积减少了约33%,而人工湿地增加了约122%.过去30年里湿地减少的速度大幅降低,由最初5523km2/a(1978~1990年)降为831km2/a(2000~2008年).(ⅲ)减少的自然湿地(包括滨海湿地和内陆湿地),其类型变化由湿地向非湿地转化的比例逐渐降低.初期(1978~1990年)几乎全部(98%)转换为非湿地;在1990~2000年间减少的自然湿地约有86%转化为非湿地,而在2000~2008年,这一比例下降为77%.(ⅳ)气候变化和农业活动是中国湿地变化的主要驱动因素,湿地变化在中国分为三大不同特征区域,即西部三省/自治区(西藏、新疆和青海)、北部两省/自治区(黑龙江和内蒙古)和其他省市区.其中西部区域尤其是青藏高原,湿地变化的驱动因子以气候增温为主;新疆湿地由于气候增温和农业活动共同作用造成变化不大.北部省/自治区的湿地变化则主要由农业活动引起;而其他省市区的湿地变化几乎完全受控于人类的农业经济活动

    基于分面搜索引擎Solr的机构知识库访问统计

    No full text
    采用Solr对中国科学院机构知识库CAS-IR的访问统计部分进行改进,结果表明改进后的系统即使在海量数据的环境下也能达到很快的响应速度。</p

    机构知识库语义知识获取方法分析及实验研究

    No full text
    [目的]&nbsp;通过分析总结和实验研究,提出并形成一种有效的语义知识获取方法,为实现机构知识库的语义化提供理论基础和可行技术路线。[方法]&nbsp;对国内外的语义知识获取方法进行对比分析,提出机构知识库语义知识获取的体系框架,并总结和深度解析其关键技术;同时,以中国科学院机构知识库平台为例进行实验研究。[结果]&nbsp;该方法可有效地从机构知识库底层的关系数据库的数据和实体关系结构中自动获取语义知识信息并转化为RDF三元组形式进行浏览和查询。[局限]&nbsp;定义一个合理有效的语义映射规则,需要经过领域专家评估、较多的人工干预以及反复实验才能确定;不同机构知识库间同一实体对象的语义知识获取关联没有涉及。[结论]&nbsp;有利于帮助后续研究人员和机构知识库开发人员更好地了解和掌握机构知识库语义知识获取的方法和关键技术,从而为提升机构知识库的服务能力奠定基础。</span

    开放知识资源分类检索机制优化研究

    No full text
    针对传统分类检索技术存在的局限性,结合开放知识资源的分类检索需求,对开放知识资源的分类检索机制进行了优化研究,包括分类索引配置的优化、分类检索过程的优化、分类检索访问的优化和客户端分类检索功能的实现。最终将研究方案应用于开放知识资源项目建设,提高了开放知识资源分类检索的响应速度和效率。</p

    CSpace 4.0功能与服务概览

    No full text
    介绍了中国科学院研究所机构知识库平台CSpace 4.0新版本的新功能和新服务
    corecore