1 research outputs found

    Hashing binary code embedding algorithm

    Get PDF
    近些年来随着移动和PC互联网等大规模数据的爆炸式增长,越来越多的研究人员开始对有效的大规模数据检索问题进行广泛而又深入的研究。通过暴力搜索直接比较查询点和数据库数据点之间的相似性显然是不可行的,因为对海量数据进行暴力搜索对计算和内存都有着极高的要求。针对这一问题,研究人员开始研究基于哈希算法的将原始数据空间中的高维特征数据转换为汉明空间中的低维哈希二值码,并通过计算原始数据在汉明空间中的哈希二值码之间的汉明距离来表征原始数据点之间的相似程度。采用哈希二值码嵌入算法有如下两方面的优势:(1)哈希二值码用二进制01序列表示,因此可有效地通过整数来存储,从而可大大降低原始海量数据的存储消耗;(2)可...The explosive growth in big data has attracted more and more attention in designing efficient indexing and search methods recently. The straightforward solution using exhaustive comparison is infeasible due to the prohibitive computational complexity and memory requirements for massive data. Therefore hashing is becoming increasingly popular for efficient retrieval for massive data. There are two ...学位:工程硕士院系专业:信息科学与技术学院_工程硕士(计算机技术)学号:3152013115330
    corecore