[发明专利]一种基于关联图的离线人脸聚类方法在审
申请号: | 202010954212.9 | 申请日: | 2020-09-11 |
公开(公告)号: | CN112347842A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 张振斌;陈杰 | 申请(专利权)人: | 博云视觉(北京)科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 北京中仟知识产权代理事务所(普通合伙) 11825 | 代理人: | 田江飞 |
地址: | 100085 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关联 离线 人脸聚类 方法 | ||
本发明公开了一种基于关联图的离线人脸聚类方法,包括:获取待聚类人脸图片;利用已训练好的卷积神经网络模型对待聚类人脸图片提取人脸特征;采用KNN算法对人脸特征构建K邻近相邻节点集合;自适应计算K邻近相邻节点集合的聚类阈值;基于相邻节点构建各节点关联图并进行迭代类别聚合;基于投票机制进行多标签清洗和节点重聚类。本发明通过提出的动态K邻近相邻节点集合构建以及分类标签的动态更新技术可以在大幅提升计算效率的同时将计算资源的使用降到最低。本发明可在高度并行化基础上,实现60分钟内完成针对百万量级的人脸图像的聚类,并且无遗漏地赋予每个人脸图像唯一类别的标签。
技术领域
本发明涉及计算机视觉、图像处理领域,特别是一种基于关联图的离线人脸聚类方法。
背景技术
随着城市信息化的不断推进,海量的图像被存储到数据库中。但是对于已存储图像信息的处理是目前具有极大挑战的难题。其中数据自动标签化是解决这一难题的关键技术,数据的自动标签化技术可以使计算机代替人力自动对数据进行归纳整理并赋予其应有的数据信息标签。自动标签化方法中聚类算法为其核心算法,目前聚类算法常见的应用领域有人脸识别、车辆检索、行人重识别等。目前公共安全领域通常会使用聚类算法为不同的目标构建档案库,如基于人脸、行人图像的一人一档,基于车辆信息的一车一档等等。
目前常用的聚类算法如K-means(K均值)聚类,谱聚类,层次聚类等方法,对未标记的人脸图像进行分组。但是,对于大规模数据聚类,上述方法存在着严重的缺陷,如K均值聚类算法需要指定聚类中心个数,而在现实世界获取的数据是无法精确预测中心个数的。而且对于超大规模数据的处理上,上述算法需要庞大的计算资源和海量的存储空间。
发明内容
本发明的目的是要解决目前技术中无法准确、高效、自动化对大规模数据聚类、标签化方法的问题,提供一种基于关联图的离线人脸聚类方法。
为达到上述目的,本发明是按照以下技术方案实施的:
一种基于关联图的离线人脸聚类方法,包括如下步骤:
S1、获取待聚类人脸图片;
S2、利用已训练好的卷积神经网络模型对待聚类人脸图片提取人脸特征;
S3、采用KNN算法对人脸特征构建K邻近相邻节点集合;
S4、自适应计算K邻近相邻节点集合的聚类阈值;
S5、基于相邻节点构建各节点关联图并进行迭代类别聚合;
S6、基于投票机制进行多标签清洗和节点重聚类。
进一步地,所述S2具体包括:
S21、截取待聚类人脸图片中的人脸图像;
S22、对人脸进行人脸关键点检测,并进行人脸矫正;
S23、将矫正后的人脸图像输入到已训练好的卷积神经网络模型,输出多维的人脸特征向量。
进一步地,所述S3具体包括:
S31、将每一幅人脸图像由卷积神经网络模型输出的人脸特征视作一个节点,计算当前样本节点与其他节点的人脸特征相似度;
S32、将计算的人脸特征相似度进行排序,并按预设相似度阈值选取当前节点的相邻节点,然后构建K邻近相邻节点集合。
进一步地,所述S4具体包括:
S41、根据K邻近节点集合的数据分布,计算该数据集下每个类别的平均预计节点个数sizeavg-count作为后续类别聚合中节点上限数量,然后增加一定的余量cmaxsize=α·sizeavg-count;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于博云视觉(北京)科技有限公司,未经博云视觉(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010954212.9/2.html,转载请声明来源钻瓜专利网。