[发明专利]一种特征对比方法、系统、设备以及介质在审
申请号: | 202010640869.8 | 申请日: | 2020-07-06 |
公开(公告)号: | CN111860627A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 王鹏飞 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 杨帆;陈黎明 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 对比 方法 系统 设备 以及 介质 | ||
本发明公开了一种特征对比方法,包括以下步骤:构建特征底库;计算所述特征底库中的每一个物体对应的多个特征向量两两之间的相似度以得到所述每一个物体对应的相似度范围;将多个物体的相似度范围取并集以得到相似度的阈值范围;计算待对比的特征向量与所述特征底库中的每一个特征向量之间的相似度;将计算得到的处于所述阈值范围内的相似度对应的特征向量进行排序;基于该排序将若干特征向量分别对应的物体ID返回给用户。本发明还公开了一种系统、计算机设备以及可读存储介质。本发明提出的方案通过对特征底库中同一物体所有特征向量计算相似度,从而确定准确的相似度阈值范围,防止由于异常情况导致的相似度过大影响实际对比结果。
技术领域
本发明涉及特征对比领域,具体涉及一种特征对比方法、系统、设备以及存储介质。
背景技术
快速比对过程是指实时提取的特征与特征底库做相似性比较,选择相似性高的特征返回其索引。相似性计算方法较多,如欧式距离、皮尔逊相关系数、余弦相似度等,核心方法都包括向量乘加运算。特征底库是预先提取好的大规模的生物识别特征,比如人脸特征向量、声纹特征向量,随着计算设备能力和需求的不断提高,底库特征已拓展到千万级或亿级。实时提取特征指客户请求比对的向量,在单设备及如此巨大的底库上完成实时特征的一一比对,其响应延迟巨大。
现有的技术方案大多基于CPU设备完成,结合大数据或搜索引擎抽取特征数据,特征数据通常为单精度固定维度向量存储,然后进行M:N的比对(M为实时特征数量,N为底库特征数量),该方案可以将数据存放于硬盘有更高的存储冗余。目前实现特征比对的算法,包括相似性和快排算法都有很多成熟的方案,比如求解欧氏距离使用双调排序进行筛选得到topN数据,这些方案在一定程度上可以满足用户需求,结合CPU计算设备面对千万~亿级别的比对可以投入使用。该方案的技术流程为:1、特征库向量存放于内存;2、当前实时特征与所有底库特征做相似性比对;3、比对结果进行快速排序。但是基于CPU设备的特征比对方案,计算吞吐小,面对大规模数据比对其延迟时间很长,影响比对系统的整体效率,如果保持高比对效率需要横向扩展CPU处理设备,增加硬件成本也会带来通信量增加的风险。
目前也有基于GPU-CUDA实现的特征比对方案,其基本流程与CPU流程类似,但其强大的浮点运算能力和并行架构使得相同任务下,计算设备的数量和需求大大减少,浮点计算吞吐能力强,可以进行多任务并行比对。但是基于GPU设备的特征比对方案,由于采用单精度向量存储,且显存空间有限,导致单设备处理任务数减少,在面对巨大特征底库时采用人工设计的相似性及快排CUDA核函数会带来效率低、计算慢的问题。
发明内容
有鉴于此,为了克服上述问题的至少一个方面,本发明实施例提出一种特征对比方法,包括以下步骤:
构建特征底库;
计算所述特征底库中的每一个物体对应的多个特征向量两两之间的相似度以得到所述每一个物体对应的相似度范围;
将多个物体的相似度范围取并集以得到相似度的阈值范围;
计算待对比的特征向量与所述特征底库中的每一个特征向量之间的相似度;
将计算得到的处于所述阈值范围内的相似度对应的特征向量进行排序;
基于所述排序将若干特征向量分别对应的物体ID返回给用户。
在一些实施例中,构建特征底库,进一步包括:
利用训练好的神经网络模型对物体的多个图像分别提取特征向量;
将提取到的多个所述特征向量的精度降低至目标精度。
在一些实施例中,将提取到的多个所述特征向量的精度降低至目标精度,进一步包括:
将构成所述特征向量的标量数据进行排序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010640869.8/2.html,转载请声明来源钻瓜专利网。