[发明专利]基于图卷积的人脸聚类方法、装置及电子设备在审
申请号: | 202111672130.6 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114333028A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 邱志鹏;盛校粼;李凡平;石柱国 | 申请(专利权)人: | 以萨技术股份有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06N3/04;G06V10/762;G06V10/74;G06K9/62;G06V10/82 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 徐丽 |
地址: | 266000 山东省青岛*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图卷 人脸聚类 方法 装置 电子设备 | ||
本发明提供了一种基于图卷积的人脸聚类方法、装置及电子设备,涉及人脸聚类技术领域,该方法包括:获取多个待聚类人脸数据,提取多个待聚类人脸数据的人脸特征,基于提取到的人脸特征构建第一K近邻图,将第一K近邻图输入到训练好的图卷积网络中,得到第一K近邻图中每个节点的密度预测值,将密度预测值低的节点与密度预测值高且连接强度最大的节点做有向连接,构建多个独立的人脸簇。这种结合了图卷积神经网络和基于密度预测值的聚类算法的方式,不需要额外构建子图,有效提高了聚类算法的运行效率和准确率。
技术领域
本发明涉及人脸聚类技术领域,尤其是涉及一种基于图卷积的人脸聚类方法及装置。
背景技术
近些年,随着人脸检测和人脸识别技术的快速发展,人脸图像能够更快捷的从互联网或监控相机中获取。对于获取到的大量为标记人脸图像,人工对其进行分组成本高且容易出现分组错误的情况,因此出现了对人脸图像进行自动分组的需求。人脸聚类是一种具有广泛应用的实用工具,能够自动化的对大量未标注人脸数据进行归类分组,有效节约数据整理的成本。
传统的聚类方法如k-means(k-means clustering algorithm)、DBSCAN(Density-Based Spatial Clustering of Applications)算法依赖于特定的假设,缺乏处理真实数据集的复杂聚类结构的能力,聚类准确率底。基于深度学习的聚类方法通常需要构建大量子图实现节点间的衔接预测,严重影响了聚类的效率。
发明内容
本发明的目的在于提供一种基于图卷积的人脸聚类方法、装置及电子设备,以提高聚类算法的运行效率和准确率。
第一方面,本发明实施例提供了一种基于图卷积的人脸聚类方法,包括:
获取多个待聚类人脸数据,提取所述多个待聚类人脸数据的人脸特征;
基于所述待聚类人脸数据的人脸特征构建第一K近邻图,其中,所述第一K近邻图包括多个节点,多个所述节点之间存在连接强度;
将所述第一K近邻图输入到训练好的图卷积网络中,得到所述第一K近邻图中每个所述节点的密度预测值;
将所述密度预测值低的所述节点与所述密度预测值高且所述连接强度最大的所述节点做有向连接,构建多个独立的人脸簇。
进一步地,将所述密度预测值低的所述节点与所述密度预测值高且所述连接强度最大的所述节点做有向连接,构建多个独立的人脸簇的步骤之后,还包括:
对多个独立的所述人脸簇进行精修,过滤多个独立的所述人脸簇中异常的节点;
计算所述异常的节点与其他所述人脸簇中心的距离,选择距离最近的人脸簇进行合并,得到优化后的人脸簇。
进一步地,在获取多个待聚类人脸数据,提取所述多个待处理聚类人脸数据的人脸特征的步骤之前,还包括:
确定人脸聚类数据集,提取所述人脸聚类数据集中每个人脸样本的人脸特征;
基于人脸样本的人脸特征构建第二K近邻图;
基于所述第二K近邻图、所述人脸聚类数据集以及预设损失函数对初始的图卷积网络进行训练得到训练好的图卷积网络。
进一步地,所述预设损失函数L基于如下公式确定:
其中,N表示输入到图卷积网络的节点数量;yi和y′i分别表示图卷积网络预测的第i个节点的密度值和该节点的标签值。
进一步地,基于节点之间的余弦相似度确定连接强度;其中,两个节点的余弦相似度similarity基于如下公知确定:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于以萨技术股份有限公司,未经以萨技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111672130.6/2.html,转载请声明来源钻瓜专利网。