[发明专利]一种人脸特征向量的高维索引的构建方法在审
申请号: | 201710525541.X | 申请日: | 2017-06-30 |
公开(公告)号: | CN107391601A | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 王佐成;张伟;马韵洁;罗晶晶;张凯;朱萍;黄翔;翟佩璇;杨超 | 申请(专利权)人: | 安徽四创电子股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 合肥和瑞知识产权代理事务所(普通合伙)34118 | 代理人: | 王挺 |
地址: | 230088 安徽省合肥*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征向量 索引 构建 方法 | ||
技术领域
本发明属于人脸图像检索领域,尤其涉及一种人脸特征向量的高维索引的构建方法。
背景技术
近几年来,全国各地的智慧城市在如火如荼的开展,视频监控行业快速发展,整个安防市场规模迅速壮大,人脸识别的重要性越来越强。
如何在千万级别的公民身份库中找出同时具备多个身份的可疑人员是长期困扰公共安全相关工作的难题。现有的工作方式主要是依靠人工判断、随机抽查等方式,无法准确、快速地找出并消除安全隐患。同时,当前的索引建立机制,随着人脸数据的特征向量维数的增加,检索效率急剧下降,已经不能满足千万级别人脸特征数据检索的需要。
因此,迫切需要一种能够针对人脸特征向量检索的索引机制,提高检索效率,以满足千万级别人脸特征数据检索的需要。
发明内容
根据现有技术中存在的问题,本发明提供了一种人脸特征向量的高维索引的构建方法,提高了检索效率,满足了千万级别人脸特征数据检索的需要。
本发明采用以下技术方案:
一种人脸特征向量的高维索引的构建方法,包括如下步骤:
S1,选取一个人脸特征数据作为一个对象存放到根结点中,根结点的最大容量为M;
S2,新插入的一个人脸特征数据作为一个新的对象存放到根结点中,如果根结点不满,则直接插入;如果根结点中对象数量已达到最大值M,则对根结点进行一分为三操作,即将根结点分裂为三个子结点,即子结点A、子结点B和子结点C,将根结点中的M个对象和新插入的一个对象相应的分别存放到三个子结点中,且三个子结点中的存放对象数量均不少于m,三个子结点的最大容量均为M;
S3,新插入的一个人脸特征数据作为一个新的对象随机存放到一个子结点中,设定该子节点为A,如果子结点A不满,则直接插入;如果子结点A中的对象数量已达到最大值M,则对子结点A中的M个对象和新插入的一个对象进行重插入操作,使得子结点A中的对象数量少于M;
S4,新插入的一个人脸特征数据作为一个新的对象继续存放到子结点A中,直至子结点中的对象数量再次达到最大值M,此时对子结点中的M个对象和新插入的一个对象进行分裂操作,得到子结点A分裂后的下一层三个子结点;同理,直到子结点B和子结点C均完成分裂操作,即均得到子结点B和子结点C分裂后的下一层三个子结点;
S5,重复步骤S3~S4,进行新插入的人脸特征数据作为对象的存放,所有人脸特征数据均存放结束后即完成了索引的建立。
优选的,步骤S3中所述的重插入操作包括如下步骤:
S11,利用最小包围圆算法和欧氏距离算法,计算子结点A中的M个对象和新插入的一个对象到子结点A的最小包围圆中心的距离D;
S12,将子结点A中的M个对象和新插入的一个对象按D值从大到小排序,取出前(M+1)/2或M/2个对象作为重插单元,插入到同层其他子结点中。
优选的,步骤S4中所述的分裂操作包括如下步骤:
S21,从子结点A中的M个对象和新插入的一个对象中任意选择三个对象,分别作为三个初始聚类的中心;
S22,计算每个初始聚类中的对象的均值V,即对每个初始聚类的中心,计算除此中心外的所有对象与此中心的均值,均值V的计算公式如下:
其中,Si表示所有初始聚类中心的对象的集合,ui表示第i个聚类的中心,xj表示子结点A中的M个对象和新插入的一个对象中,除此中心ui之外的其余所有对象;
S23,根据均值V,通过欧氏距离算法计算每个对象与三个初始聚类中心的距离,将对象与三个初始聚类中心的距离最小的那个初始聚类中心作为此对象的聚类中心,得到重新划分的三个聚类;
S24,重复步骤S22~S23,直至三个初始聚类中心的均值与各自上一个均值之间差值的绝对值小于指定阈值K;
S25,最终得到的三个聚类,作为分裂后的下一层三个子结点。
优选的,所述索引构建完成后,可对其中的对象进行检索;检索过程包括如下步骤:
S31,输入一个查询对象P,对每个没有被访问过的非叶子结点,利用最小包围圆算法和欧氏距离算法计算每个父结点与其子结点形成的最小包围圆的排序值,并将它们按照升序或降序排序,保存在活动分枝列表中;
S32,根据剪枝规则,对活动分枝列表进行修剪,删除不必要的分枝;
S33,对活动分枝列表中的每个最小包围圆重复步骤S32,直到活动分枝列表为空;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽四创电子股份有限公司,未经安徽四创电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710525541.X/2.html,转载请声明来源钻瓜专利网。