[发明专利]一种基于特征编码的高效人脸聚类方法有效
申请号: | 202010299063.7 | 申请日: | 2020-04-16 |
公开(公告)号: | CN111539285B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 汪东华 | 申请(专利权)人: | 艾特城信息科技有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/762 |
代理公司: | 上海领洋专利代理事务所(普通合伙) 31292 | 代理人: | 李皓 |
地址: | 200051 上海市长*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 编码 高效 人脸聚类 方法 | ||
1.一种基于特征编码的高效人脸聚类方法,其特征在于,至少包括:
(1)提取人脸原始特征,并进行特征编码,建立编码表,创建特征编码的索引引擎库;
(2)以创建的索引引擎库为基础,根据获取人脸特征与编码后的人脸特征值匹配,进行初步分组;在(2)中,对存储人脸特征库的人脸编码表依次进行分布式搜索,按照编码后距离计算方式返回匹配距离值小于阈值T的结果,匹配成功的数量定义为当前人脸引用数,因此对整个人脸编码库完成遍历后,会得到和人脸表相同数量的引用计数表M,按照此引用次数进行排序,可以直观得到某个人脸被引用的计数高低频次;
在(2)中,对引用计数表M按照降序排序后,按顺序从表首开始,根据人脸特征编码表再在索引引擎库中搜索,将所有距离值小于阈值T的依次归到同一组内,并标记为已分类;对于距离值大于阈值T的人脸,根据引用计数表依次划分成新组,直到所有人脸都被标记为已分类,此时完成初步分组的原始人脸分组集合S;
(3)计算初步分组中每一组的人脸平均特征,进行分组间的特征值比对,通过合并形成新的分组,得到最终结果,在(3)中,对初步分组的人脸集合S计算人脸平均特征,分别匹配当前组人脸与其他分组人脸的相似度,若分组间距离值小于设定阈值T,则将二者分组进行合并,从而形成新的分组,循环所有分组比对,得出最终结果。
2.如权利要求1所述的基于特征编码的高效人脸聚类方法,其特征在于,实现(1)的步骤至少包括如下操作:
(10)采用人脸检测算法对场景内人脸进行检测,并对检测得到的人脸采用卷积神经网络进行特征提取,得到原始人脸特征的图像库;
(11)通过聚类的方式定时对图像库中的特征进行特征编码,并对编码后的特征进行相似性距离计算;
(12)创建分层索引结构,根据指数衰减的概率分布规则,设计“低-中-高”的图层状索引结构,以加速检索效率;
(13)将原始特征编码与分层索引结构结合,形成索引引擎库。
3.如权利要求2所述的基于特征编码的高效人脸聚类方法,其特征在于,在(11)中,进行特征编码的方式为:对人脸特征的图像库中的每条人脸特征向量平均划分成K个子域,之后将所有特征数量进行聚类得到C个聚类中心,因此所有K个子域内的人脸特征可得到K*C个聚类中心;在任意子域内子向量段的编码用该子向量所属的聚类中心的编码值来表示,从而用较短的编码值表示原始特征向量,完成所有样本数据的编码工作。
4.如权利要求3所述的基于特征编码的高效人脸聚类方法,其特征在于,在(11)中,对编码后的特征进行相似性距离计算方式为:根据特征编码得到K个人脸特征向量的子域,得到K个子向量,将K个子向量分别在K*C的距离矩阵中获取每一个子向量到聚类中心向量的距离,距离越小,表示查询的人脸向量与图像库中的样本越相近。
5.如权利要求4所述的基于特征编码的高效人脸聚类方法,其特征在于,在(12)中,图层状索引结构高层结构中的节点为低层结构的子集,最低层包含所有图节点;查询时从高层选择最近邻节点开始,作为下一低层的起始点,逐步向下实现整个检索过程;因此,低层对应的节点之间相似度越高,距离越近;高层对应的节点之间相似度越低,距离越远。
6.如权利要求5所述的基于特征编码的高效人脸聚类方法,其特征在于,在(12)中,在创建分层图结构时,对原始特征向量进行特征编码后作为图节点,插入节点到具体层级,然后在每层图结构中寻找K个最近邻点,并相互连接,从而完成当前层节点的连接与构建。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于艾特城信息科技有限公司,未经艾特城信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010299063.7/1.html,转载请声明来源钻瓜专利网。