[发明专利]一种基于非线性增强子空间聚类的图像识别方法有效
申请号: | 201911259835.8 | 申请日: | 2019-12-10 |
公开(公告)号: | CN111027624B | 公开(公告)日: | 2022-10-21 |
发明(设计)人: | 陈少敏;王丽娟;尹明;郝志峰;蔡瑞初;温雯;陈炳丰 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V40/16 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 非线性 增强 空间 图像 识别 方法 | ||
本发明公开了一种基于非线性增强子空间聚类的图像识别方法,首先获取图像数据集;利用局部线性嵌入算法求解图像数据集的局部线性表达矩阵,以提取图像数据集的非线性流形结构;构建基于块对角约束及非线性流形结构的非线性增强子空间聚类目标函数;对非线性增强子空间聚类目标函数进行初始化并求解出最优解;基于最优解构建拉普拉斯矩阵,并通过NCut或K‑means得到最终图像数据集的聚类结果,完成图像识别。本发明通过预先学习图像的非线性流形结构,即局部线性结构拟合非线性流形从而在提高图像识别效果;同时强制构造块对角作为约束条件,通过迭代求解出的邻接矩阵的块对角结构更加契合子空间聚类的目标效果。
技术领域
本发明涉及模式识别计算技术领域,尤其涉及一种基于非线性增强子空间聚类的图像识别方法。
背景技术
人脸识别是人类非常重要的感知能力。随着计算机技术的发展,人脸识别成为一个越来越热门的话题。支付宝推广的“刷脸支付”、社会治安管理、地铁“刷脸过闸”等等无一不是人脸识别落地实际生活应用的体现。由于人脸图像会受到光照、姿态等外部因素和表情、年龄等内部因素的影响,另外,有些人的人脸很相似。这些因素会增加人脸图像的类内差异性和类间相似性,给识别带来很大的困难。研究证明不同光照下的人脸图像可以用一个低维子空间近似表示,而含有不同人的一组人脸图像可以看作是多维线性子空间的并集,从而人脸识别问题可以转化为子空间聚类问题。通过子空间聚类技术,将分属于同一个体的图像数据化分为一类,从而完成人脸识别任务。
然而现有的大多数子空间分割方法(如SSC和LRR)都采用替代结构前置(如稀疏和低秩)来构造关联矩阵,但由于没有连接的条件,因此不能很好地利用关联矩阵子空间间样本。同时LRR在数据量不充分的情况下,由于学习不充分导致图像识别聚类效果不佳。此外,由于图像普遍为高维数据,具有很强的非线性流形结构,线性的子空间聚类方法无法很好地利用这些流形结构信息。
发明内容
本发明为解决现有图像识别方法由于在子空间聚类中局部信息缺失而影响图像识别精度的问题,提供了一种基于非线性增强子空间聚类的图像识别方法。
为实现以上发明目的,而采用的技术手段是:
一种基于非线性增强子空间聚类的图像识别方法,包括以下步骤:
S1.获取图像数据集;
S2.利用局部线性嵌入算法求解所述图像数据集的局部线性表达矩阵,以提取所述图像数据集的非线性流形结构;
S3.构建基于块对角约束及非线性流形结构的非线性增强子空间聚类目标函数;
S4.对所述非线性增强子空间聚类目标函数进行初始化并求解出最优解;
S5.基于所述最优解构建拉普拉斯矩阵,并通过NCut或K-means得到最终图像数据集的聚类结果,完成图像识别。
优选的,所述步骤S1还包括以下步骤:对所述图像数据集中的图像进行裁剪为统一的大小;若图像数据集中包含彩色图像,则对彩色图像进行降维处理。
优选的,所述步骤S2的具体步骤包括:基于KNN算法,按欧式距离作为度量,计算距离所述图像数据集X中数据点xi最近的k个最近邻,计算数据点xi与k个最近邻之间的重构权值wij,通过使重构误差最小求得最优解W*,则所述图像数据集的局部线性表达矩阵LM=tr(X(I-W*)T(I-W*))。
优选的,所述步骤S3中的非线性增强子空间聚类目标函数具体为:
s.t.diag(B)=0 B=BT,B≥0
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911259835.8/2.html,转载请声明来源钻瓜专利网。