29 research outputs found

    CMIU:A Web Crawler Method of Increment Updating

    Get PDF
    本文针对目前Web信息挖掘中存在的各种问题,对网络爬虫系统进行研究,提出了一种基于HTTP协议原理、旨在减少网络爬虫系统运行时网络流量的Web页面收集方法———增量更新Crawler方法。该方法通过Web预取技术对现有的Web链接数据库进行演化更新,可以在减少网络流量的同时获得接近现有网络爬虫系统的效果。Face to the problems which exist in Web information mining the paper studies network crawler systems,and proposes a HTTP-based crawling method of in crement updating for reducing the network flow when a network crawler system runs.The method updates the current Web link database by the Web prefetch technique,and shows the effect close to the current network crawler systems when reducing the network flow

    Multi abstract remove repeat method for web mining research

    Get PDF
    针对目前Web信息挖掘中存在大量页面重复的问题,从Web信息的组织角度对其中的一些关键问题进行深入分析,提出了基于关键词的部分相似页面消重算法——Web多摘要消重方法(multiabstractremoverepeat,MARR)。MARR方法对传统基于词表和倒排文件的Web信息数据库进行改装,增加一个字段用于记录关键词所对应的摘要块号,采用文本摘要算法,按倒排文件方式索引,根据内容基于查询词目的相似程度,在检索过程中过滤或标识与查询词目相关的部分内部重复现象,以获得更合理的检索结果组织形式。MARR方法还将传统按PageRank值顺序排列改成树型组织方式,以方便用户信息发现的需要。该方法在基于三明钢铁集团MES智能信息代理的原型化Web检索系统中得到应用。With regard to the organization of web information retrieval,some pivotal problems of web information mining are analyzed and an arithmetic to remove repeats of similar pages searched by keyword — Multi abstract remove repeat(MARR) is presented,which changes the traditional web information database composed of words tables and converse files,adds a field to record the abstract number corresponded with key words,text-abstract arithmetic,sorts is adopted by the index of converse file,the repeats are filtered and marked according to the similarity of content from retrieved entry in order to obtain a more reasonable retrieval result,and normal structure sorted is substituted by PageRank for users' needs in information mining.This arithmetic is applied to the archetypal web retrieval system origi-nated from MES information system agent of Sanming steel company

    生态补偿对农牧交错区农户生计的影响——以新疆阿勒泰地区青河县为例

    No full text
    农户生计的微观机理研究是农村区域可持续发展研究的基础内容之一,也是农牧民增收、农牧业发展、农村生态环境保护三者协调发展亟待解决的关键问题之一。本文针对干旱区农牧交错地带实施的退牧还草、退耕还林等生态工程,在可持续分析框架下构建生计资本评估指标体系,并在新疆阿勒泰地区青河县开展实地调研,对生态补偿对农户生计资本和生计策略的影响机理进行实证研究,探索生计资本与生计策略的相互关系,揭示农牧民生计策略转化的关键影响因子,最后提出干旱区农牧交错地带农户生计可持续发展的政策与建议,为干旱区生态补偿政策的有效实施提供一定的理论借鉴与现实参考。 主要研究结论如下: (1)农牧民生计现状特征。①生计资本。研究区自然资本存量较低,使得丰富的人力资本和较充足的金融资本未能充分发挥形成最佳生计策略,今后需要注重自然资本的保护性发展,并提高其它生计资本之间的转换能力。样本农户的生计资本总指数为2.3603,异质性农户则表现为退耕退牧户最高,依次是退牧户、退耕户。②生计策略。种植业、畜牧/养殖业、外出打工等方式是青河县农户主要采取的生计策略,总体看来从事非农生计活动的农牧民比例较少;退牧户和退耕退牧户家庭选择的生计方式对自然资源的依赖程度高于退耕户。从农户家庭选择生计活动的种类数看来,退耕户最多,退耕退牧户次之,退牧户最少,生计多样化指数分别为1.95、1.50、1.43。 (2)生态补偿对农户生计资本的影响。①生态补偿后,青河县样本户农牧民的生计资本总指数增加,其中农户的物质资本、社会资本、心理资本和金融资本指数增加,自然资本和人力资本指数降低;退耕退牧农户的生计资本总指数增幅最大,依次是退耕户、退牧户。②生态补偿对异质性农户生计资本结构的影响不同,样本农户的生计可持续力是生态补偿前生计可持续力的0.88倍,退耕户、退牧户、退耕退牧户的生计可持续力分别为生态补偿前的1.07、1.00、0.63倍。③生态补偿改变了样本农户、退耕户、退牧户、退耕退牧户与各生计资本之间的相关关系,说明各类生计资本之间还尚未达到相对稳定的相互影响或转换的良好阶段。 (3)生态补偿对农户生计策略的影响。①生态补偿促使农户的生计方式由传统的农牧业向非农产业转变,这种转变力度在退耕户、退牧户、退耕退牧户中存在差异。②生态补偿对异质性农户生计活动结构的影响表现在:退牧户从事畜牧/养殖业的人口比例变化最大,从事打工的人口比例变化次之;退耕户从事种植业的人口比例变化最大,依次是经商和打工;退耕退牧户从事畜牧/养殖业的人口比例变化最大,依次是从事工资性工作、外出打工和个体运输。③生态补偿促进了农户的生计策略向着多元化方向发展,但其驱动能力有限,目前青河县农户的生计活动多样化程度仍然不高;其中退耕户、退耕退牧户、退牧户的多样化指数分别增加了0.40、0.29、0.19。 (4)生态补偿对农户生计资本与生计类型关系的影响。①目前,当样本户拥有比较多的人力、自然和金融资本时,农牧民所采取的生计策略以非农活动为主,而当农牧民拥有比较多的物质资本时,农牧民不愿意放弃其原有的农业生计活动。②物质资本的增加将导致样本户生计策略“非农化”发生的概率减少0.034倍,人力、自然与金融资本可推动“非农化”发生的概率分别增加106.999、6.215和3.700倍。③退耕户、退牧户、退耕退牧户对从事农业或非农生计策略的资本敏感性响应存在差异,且生态补偿对二者关系的影响在样本户和异质性农户中均存在一定差异。 (5)生态补偿对农户生计资本与生计方式多样化关系的影响。①相对于只选择一种类型生计方式的样本户来说,自然、人力和金融资本每提高一个单位,农户选择两种生计活动方式的概率将分别增大124.711、40.650、2.790倍,物质资本每增加一个单位会引起农户选择一种活动的概率提高11.917倍。②自然、人力和金融资本每提高一个单位,农户选择三种生计活动方式的概率将分别增大334.287、145.620、13.184倍,物质资本每提高一个单位,农户选择一种生计方式的概率扩大43.641倍。 (6)本研究最终提出如下政策建议。需优化资源配置,努力实现生计系统与生态环境系统的良性耦合。依据农牧民生计资本与生计策略的不同关系类型,评估现有的生态补偿政策对农牧民生计的影响效果,确定后续生态补偿政策实施过程中异质性农户的最优先补偿对策。分别从农户增强自我发展能力、生态补偿项目实行参与式的管理运作模式、政府创新配套保障支持措施等三个维度提出优化农牧民积极参与生态补偿项目的有效路径建议

    The Error of On-line Survey and Its Handling

    No full text
    由于网络调查本身还有许多不完善的地方,所以调查结果受非抽样误差的影响很大。随着中国网络的普及,网络调查的非抽样误差有减少的趋势。可通过正确界定网络调查的适用范围、更好地与抽样技术相结合、科学设计调查方案、加强网络调查的安全、对估计的结果进行校正等途径来降低网络调查的误差,提高其可信度。The result of on-line survey is affected by the non-sampling error greatly because of many defects of on-line survey.The non-sampling error becomes less and less with the popularization of the internet survey.We can reduce the non-sampling error and enhance its reliability by limiting the scope of internet survey correctly,combining with the sampling technique well,designing the investigation plan reasonably,enhancing the security of internet survey and adjusting the result of estimation.教育部博士点基金项目《网络调查的理论方法与应用研究》(01JB910001

    The Application of Geostatistics to Analysis of Grain Size Trend in the Eastern Beibu Gulf

    No full text
    在北部湾东部海域采集表层沉积物71个,通过粒度分析获得其粒度参数(平均粒径、分选系数、偏态),用克里格插值法将不规则采样站位的粒度参数内插为规则网格分布的相应粒度参数。采用地统计法分析其空间相关性,计算度量空间相关性范围的参数,即半方差图中的变程值。结果表明,使用地统计分析获得的粒度参数变程值物理意义较为明确,可作为粒径趋势分析模型的特征距离,其中分选系数变程值作为特征距离的计算结果与前人的海流、沉积物输运信息更为吻合;这在一定程度上消除了传统方法(试算法或经验估计法)获取特征距离可能造成的模型计算误差。采用不同间距插值时得到的粒径趋势矢量具有不同的空间分辨率,其中高分辨率的细化图所反映的海底沉积物净输运趋势与余流和环流等所反映的沉积物输运细节特征吻合较好,低分辨率的概化图可大致反映该区域沉积物的总体输运趋势。地统计分析的结果对未来研究工作中采样间距的选取也具有指导意义。A total of 71 surficial sediment samples are collected in the eastern Beibu Gulf, and then the moment parameters (i.e. mean size, sorting coefficient and skewness) are obtained by grain size analysis. By using kriging interpolating methods, the regular meshes of grain size parameters are calculated. A geostatistic analysis is applied to study the spatial autocorrelation for these parameters; while the range, a parameter in the semivariogram metering the bound of the spatial autocorrelation, is estimated. It shows that the range for sorting coefficient is physically meaningful, and also the obtained grain size trends are consistent with the annual ocean circulation pattern and sediment transport rates from previous studies. Thus, the range from the sorting coefficient variogram can be used as the characteristic distance in the grain size trend analysis model, which may remove the bias caused by traditional determination of characteristic distance (e.g. based on experience or testing methods). The sediment transport patterns are retrieved on the basis of grain size parameters interpolated with varied distances, which indicates that the small interpolation distance can produce better transport pattern with high resolution and give more detailed information. Hence, the results from geostatistic analysis can be guidable in determination of sampling stations density in the future field work.国家908专项(908-01-ST09);; 国家大学生创新训练计划项目(SIT-05);; 教育部“新世纪优秀人才支持计划”(NCET-06-0446);; 国家基础科学人才培养基金(J0630535)~

    Sediment transport patterns in the eastern Beibu Gulf based on grain-size multivariate statistics and provenance analysis

    No full text
    通过对北部湾东部海域表层底质样的粒度和重矿物分析,获得了粒度和矿物组成特征。对粒度进行因子分析获得了4个主控因子,其中因子2和3分别代表细颗粒的悬移质组分和陆源粗颗粒推移质组分,指示来自琼州海峡和北部湾西岸、西北岸的物源贡献,而且因子2的高得分区与弱环流背景相吻合;因子4反映了粤西和海南岛东岸沿岸流的物源贡献。采用重矿物组合,将研究区沉积物的物质来源划为4个分区。分别对4个物源分区使用粒径趋势分析模型,把它们合并后获得了整个研究区的趋势矢量,其中海湾北部沉积物输运汇聚中心的位置与余环流的中心位置基本一致,海南岛西部海域沉积物显示为向北输运的特征,与地貌、水动力特征基本吻合,在一定程度上可消除物源混合造成的影响。在使用粒径趋势分析模型获取沉积物净输运方向时,需要综合考虑物源差异和空间尺度对沉积物粒径趋势的影响。Sediment samples collected from the eastern Beibu Gulf were analyzed in the laboratory to obtain grain-size distributions and mineral components.Four main control factors are obtained using a factor analysis.Factor 1 is contributed by 2.5Φ-3.75Φ and 5.75Φ-7.75Φ.Factor 2 respects fine suspended load component,indicating that the provenance contribution from the Qiongzhou Strait and the high score area is consistent with the weak circulation.Factor 3 is a indicator of terrigenous coarse bedload component from the west and northwest coast of the Beibu Gulf.Factor 4 can reflect the transportation by the coastal current along the east coast off Hainan Island and the west of Guangdong Province.The study area can be separated into four subareas of the sediment sources on the basis of heavy mineral analysis.A grain-size trend analysis model is separately used for the four subareas to estimate the net sediment transport pathways,which can remove the affects induced by the sediment mixing from different sources.A converge center of grain-size trend vectors in the area of the west of Hainan Island might result from the mixing of different sources of sediments,instead of sediment transport.Actually,the northward transport dominates this area of the west of Hainan Island.Another converge center in the northern area is well agreement with the local geomorphology and large-scale ocean circulation pattern.Thus,the application of grain-size trend should consider the effect of sediment sources and spatial scales in order to derive the reasonable net sediment transport pathways.国家和海南省“九2八”专项资助(908-01-ST09;HN908-02-05);国家大学生创新训练计划项目资助(061028405);国家基础科学人才培养基金项目资助(J0630535

    南京汤山洞穴碳酸盐沉积物的电离质谱铀系年代

    No full text

    最近11万年来东亚季风轨道与千年尺度气候变率在南京下蜀黄土中的记录

    No full text
    对南京李家岗下蜀黄土剖面上部的近20 m地层进行野外观察和室内研究,划分出5层黄土和5层古土壤,按5 cm间距采集了Rb/Sr、色度、磁化率和粒度样品,并在剖面和可追索的相邻剖面上采集了13个光释光测年样品。分析结果显示,Rb/Sr、色度和磁化率等夏季风代用指标曲线所表现的4次岁差变率振荡具有高度的一致性,依据气候地层对比和光释光测年结果,将这一部分下蜀黄土对应于末次间冰期-冰期的氧同位素2~5阶段 (MIS2~MIS5),确定了各层的时代归属。在此基础上,以粗粒度组份含量作为冬季风代用指标,进一步揭示了110 ~20 kaB.P.的轨道与千年尺度气候变化特征,确定了11次降温事件和23次D-O气候旋回。与北方黄土所显示的东亚季风高纬驱动机制不同的是,下蜀黄土显示出明显的低纬度气候信号。</p
    corecore