[发明专利]高维近邻对搜索方法和系统在审
申请号: | 201810179962.6 | 申请日: | 2018-03-05 |
公开(公告)号: | CN110309139A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 童毅轩;张佳师;姜珊珊;郑继川;董滨 | 申请(专利权)人: | 理光软件研究所(北京)有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458 |
代理公司: | 北京东方灵盾知识产权代理有限公司 11506 | 代理人: | 王君昌;郑利华 |
地址: | 100044 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 高维 样本 候选组 近邻搜索 签名生成 数值生成 样本向量 预设要求 | ||
本发明提出了一种高维近邻对搜索方法和系统,其中,高维近邻对搜索方法包括以下步骤:根据样本向量的数值生成对应的样本签名;根据样本签名生成近邻候选组;计算每个近邻候选组中的任意两个样本之间的距离,将距离满足预设要求的样本对作为近邻搜索结果。由此,实现了高维近邻对的有效搜索,满足用户的搜索需求,且该方法简单,易于实现。
技术领域
本发明涉及计算机技术领域,尤其涉及一种高维近邻对搜索方法和一种高维近邻对搜索系统。
背景技术
随着科学技术的发展,大规模搜索引擎必须具备有效快速的搜索能力,目前常用的搜索方法包括k-d树,R-树等。但是,这两种数据结构以及它们的变换结构只适用于搜索维数较低的数据。为了增加搜索精度,用于表征待搜索目标如图像的特征向量往往具有高维特性,其维数数量级可达到105。当数据的维数超过100,甚至达到上千维时,上述数据结构的搜索能力将会急速地衰退。因此,如何实现高维近邻对的有效搜索,仍具有很高的研究价值。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种高维近邻对搜索方法,以实现高维近邻对的有效搜索,满足用户的搜索需求。
本发明的第二个目的在于提出一种非临时性计算机可读存储介质。
本发明的第三个目的在于提出一种计算机程序产品。
本发明的第四个目的在于提出一种高维近邻对搜索系统。
为达到上述目的,本发明第一方面实施例提出了一种高维近邻对搜索方法,包括以下步骤:根据样本向量的数值生成对应的样本签名;根据所述样本签名生成近邻候选组;计算每个近邻候选组中的任意两个样本之间的距离,将距离满足预设要求的样本对作为近邻搜索结果。
根据本发明实施例的高维近邻对搜索系统,首先根据样本向量的数值生成对应的样本签名,然后根据样本签名生成近邻候选组,进而计算每个近邻候选组中的任意两个样本之间的距离,并将距离满足预设要求的样本对作为近邻搜索结果,由此,实现了高维近邻对的有效搜索,满足用户的搜索需求,且该方法简单,易于实现。
另外,根据本发明上述实施例的高维近邻对搜索方法还可以具有如下附加的技术特征:
根据本发明的一个实施例,所述样本签名为二值向量。
根据本发明的一个实施例,所述根据样本向量的数值生成样本签名,包括:通过投影矩阵R(k×d)将样本向量从原始向量映射到目标向量,其中,d是原始向量的维度,k是目标向量的维度,d大于k;如果所述目标向量的值不小于零,则在样本签名的相应位置赋1;如果所述目标向量的值小于零,则在样本签名的相应位置赋0。
根据本发明的一个实施例,所述投影矩阵R(k×d)由高斯分布N(0,1/k)随机生成。
根据本发明的一个实施例,所述根据所述样本签名生成近邻候选组,包括:S21,构造深度为N的二叉树,并将所述样本签名保存在所述二叉树的叶节点中,其中,从所述二叉树的根节点到叶节点的路径与所述样本签名前N维的数值对应,前N位签名相同的样本保存在同一个叶节点中,N小于所述样本签名的长度M;S22,当叶节点中的样本签名数量大于第一预设值T时,将第N+1位数值不同的样本签名分入该叶节点下的两个不同的子叶节点;S23,对树进行剪枝,将第N层的叶节点剪除;S24,重复步骤S22和S23,直至不存在需要切分的叶节点。
根据本发明的一个实施例,所述将距离满足预设要求的样本对作为近邻搜索结果,包括:分别将计算出的同一个近邻候选组中的样本对之间的距离进行排序,并获取前K个距离较小的样本对;将获取到的不同近邻候选组中的K个样本对进行排序,并将前K个距离较小的样本对作为所述近邻搜索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于理光软件研究所(北京)有限公司,未经理光软件研究所(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810179962.6/2.html,转载请声明来源钻瓜专利网。