[发明专利]一种基于关联图的离线人脸聚类方法在审

申请号：	202010954212.9	申请日：	2020-09-11
公开（公告）号：	CN112347842A	公开（公告）日：	2021-02-09
发明（设计）人：	张振斌;陈杰	申请（专利权）人：	博云视觉(北京)科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/04
代理公司：	北京中仟知识产权代理事务所(普通合伙) 11825	代理人：	田江飞
地址：	100085 北京市海淀区西***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于关联离线人脸聚类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于关联图的离线人脸聚类方法，包括：获取待聚类人脸图片；利用已训练好的卷积神经网络模型对待聚类人脸图片提取人脸特征；采用KNN算法对人脸特征构建K邻近相邻节点集合；自适应计算K邻近相邻节点集合的聚类阈值；基于相邻节点构建各节点关联图并进行迭代类别聚合；基于投票机制进行多标签清洗和节点重聚类。本发明通过提出的动态K邻近相邻节点集合构建以及分类标签的动态更新技术可以在大幅提升计算效率的同时将计算资源的使用降到最低。本发明可在高度并行化基础上，实现60分钟内完成针对百万量级的人脸图像的聚类，并且无遗漏地赋予每个人脸图像唯一类别的标签。

技术领域

本发明涉及计算机视觉、图像处理领域，特别是一种基于关联图的离线人脸聚类方法。

背景技术

随着城市信息化的不断推进，海量的图像被存储到数据库中。但是对于已存储图像信息的处理是目前具有极大挑战的难题。其中数据自动标签化是解决这一难题的关键技术，数据的自动标签化技术可以使计算机代替人力自动对数据进行归纳整理并赋予其应有的数据信息标签。自动标签化方法中聚类算法为其核心算法，目前聚类算法常见的应用领域有人脸识别、车辆检索、行人重识别等。目前公共安全领域通常会使用聚类算法为不同的目标构建档案库，如基于人脸、行人图像的一人一档，基于车辆信息的一车一档等等。

目前常用的聚类算法如K-means(K均值)聚类，谱聚类，层次聚类等方法，对未标记的人脸图像进行分组。但是，对于大规模数据聚类，上述方法存在着严重的缺陷，如K均值聚类算法需要指定聚类中心个数，而在现实世界获取的数据是无法精确预测中心个数的。而且对于超大规模数据的处理上，上述算法需要庞大的计算资源和海量的存储空间。

发明内容

本发明的目的是要解决目前技术中无法准确、高效、自动化对大规模数据聚类、标签化方法的问题，提供一种基于关联图的离线人脸聚类方法。

为达到上述目的，本发明是按照以下技术方案实施的：

一种基于关联图的离线人脸聚类方法，包括如下步骤：

S1、获取待聚类人脸图片；

S2、利用已训练好的卷积神经网络模型对待聚类人脸图片提取人脸特征；

S3、采用KNN算法对人脸特征构建K邻近相邻节点集合；

S4、自适应计算K邻近相邻节点集合的聚类阈值；

S5、基于相邻节点构建各节点关联图并进行迭代类别聚合；

S6、基于投票机制进行多标签清洗和节点重聚类。

进一步地，所述S2具体包括：

S21、截取待聚类人脸图片中的人脸图像；