[发明专利]一种检索方法和装置有效
申请号: | 201810979597.7 | 申请日: | 2018-08-24 |
公开(公告)号: | CN110895573B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 虞洋;王正;陈明龙 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/51 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检索 方法 装置 | ||
1.一种检索方法,其特征在于,所述方法包括:
将第一存储介质中的第一距离表和第一索引集合存储至第二存储介质;其中,所述第一存储介质中存储有至少两个特征向量的索引以及基于待检索特征向量与多个码书确定的多个距离表,所述多个码书是所述至少两个特征向量经聚类后得到的多个簇对应的码书,簇与码书一一对应,所述距离表中包括所述待检索特征向量的多个子特征向量与码书中相应中心点之间的距离值;特征向量的索引包括一级索引和二级索引,所述一级索引用于指示特征向量所属的簇的簇号,所述二级索引用于指示特征向量经所述特征向量所属的簇对应的码书处理后得到的量化索引,所述量化索引包括所述特征向量中的每个子特征向量的量化索引,距离表与一级索引一一对应;所述第一距离表是所述多个距离表中的任一距离表;所述第一索引集合是所述至少两个特征向量中的第一类特征向量的二级索引构成的集合,所述第一类特征向量的一级索引与所述第一距离表对应的一级索引相同;所述第一存储介质和所述第二存储介质归属于同一个服务器;
根据所述第二存储介质中存储的所述第一距离表和所述第一索引集合中的二级索引,获取所述第一类特征向量与所述待检索特征向量之间的距离;
根据所述第一类特征向量与所述待检索特征向量之间的距离,在所述至少两个特征向量中确定与所述待检索特征 向量匹配的特征向量。
2.根据权利要求1所述的检索方法,其特征在于,所述方法还包括:
将所述第一存储介质中的第二距离表和第二索引集合存储至所述第二存储介质;其中,所述第二距离表是所述多个距离表中的除所述第一距离表之外的任一距离表;所述第二索引集合是所述至少两个特征向量中的第二类特征向量的二级索引构成的集合,所述第二类特征向量的一级索引与所述第二距离表对应的一级索引相同;
在获取所述至少两个特征向量中的所有所述第一类特征向量与所述待检索特征向量之间的距离之后,根据所述第二存储介质中存储的所述第二距离表和所述第二索引集合中的二级索引,获取所述第二类特征向量与所述待检索特征向量之间的距离;
所述根据所述第一类特征向量与所述待检索特征向量之间的距离,在所述至少两个特征向量中确定与所述待检索特征 向量匹配的特征向量,包括:根据所述第一类特征向量与所述待检索特征向量之间的距离和所述第二类特征向量与所述待检索特征向量之间的距离,在所述至少两个特征向量中确定与所述待检索特征 向量匹配的特征向量。
3.根据权利要求1或2所述的检索方法,其特征在于,所述第一存储介质中还存储有所述至少两个特征向量的索引构成的序列,所述序列中具有相同一级索引的特征向量的索引连续排列;
在从所述第二存储介质中读取所述第一距离表和所述第一索引集合中的二级索引之前,所述方法还包括:根据所述序列获取所述第一索引集合。
4.根据权利要求3所述的检索方法,其特征在于,对所述至少两个特征向量的索引进行排序,得到所述序列,包括:
按照所述至少两个特征向量的一级索引对应的距离表的编号从小到大或从大到小的顺序,对所述至少两个特征向量的索引进行排序,得到所述序列。
5.根据权利要求1或2所述的检索方法,其特征在于,所述第一存储介质包括内存或显存,所述第二存储介质包括高速缓存cache。
6.根据权利要求1或2所述的检索方法,其特征在于,所述至少两个特征向量包括第一特征向量,所述方法还包括:
按照聚类算法对所述至少两个特征向量进行聚类,以将具有相似特征的特征向量归为一个簇,并将所述第一特征向量所属的簇的簇号作为所述第一特征向量的一级索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810979597.7/1.html,转载请声明来源钻瓜专利网。