[发明专利]一种基于多视角谱聚类的图像识别方法在审
申请号: | 201611204912.6 | 申请日: | 2016-12-23 |
公开(公告)号: | CN106599932A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 李阳;张元元;姜树明;李凤娇;聂明钰 | 申请(专利权)人: | 山东省科学院情报研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 济南圣达知识产权代理有限公司37221 | 代理人: | 李健康 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视角 谱聚类 图像 识别 方法 | ||
技术领域
本发明涉及一种基于多视角特征的图像识别方法,特别涉及到一种基于Hessian正则化的多视角谱聚类的图像识别方法,属于图像识别领域。
背景技术
随着计算机技术和存储技术的不断发展,大数据量的图像获取也越来越容易。图像识别是对输入的图像信息分析并提取图像的特征,根据图像的特征进行识别分类的技术,是模式识别与人工智能领域的研究热点。在实际应用中,大部分图像信息都是未标记的,对数据标记费时费力。随着社会的需要,需要分类识别对象的内容越来越复杂,如何能高效准确地将大量未标记图像数据进行识别分类是当前研究的热点问题。
谱聚类算法是无监督学习的一个重要的研究方向。它以图论作为理论基础,将聚类问题转化为图论中的对无向加权图的最优分割问题。
现有的多视角的图像识别方法大多是基于拉普拉斯正则化的多视角谱聚类方法,首先分别构造不同视角样本之间的相似度矩阵,然后计算其拉普拉斯矩阵,求取其特征值及特征向量,再根据合适的特征向量聚类不同的数据点。
拉普拉斯正则化是基于函数的一阶导数,Hessian正则化是基于对模型误差泛函参数的二阶导数,相比于拉普拉斯,Hessian方法能够更准确地描述数据潜在的局部几何特征,反应出更精细的局部结构,从而有更好的识别精确度。
发明内容
为实现有效的多视角图像识别,本发明提出一种基于Hessian正则化的多视角谱聚类的图像识别方法。该方法利用Hessian矩阵更好的挖掘出样本数据的内部结构信息,并通过多视角之间Hessian矩阵的相互修正实现信息互换,从而使样本的多视角信息可以得到充分且有效的利用,提高识别的准确度。
本发明提出的技术方案如下:
一种基于Hessian正则化的多视角谱聚类的图像识别方法,其特征在于:该方法利用图像样本的Hessian矩阵,更好的获取样本内部结构信息,通过多视角之间Hessian矩阵的不断修正,提高Hessian矩阵对聚类效果提升的贡献,具体包括如下步骤:
(1)提取输入图像的两个不同视角的特征;
(2)分别计算每个视角的Hessian矩阵,第一视角样本的Hessian矩阵用H1表示,第二视角样本的Hessian矩阵用H2表示;
(3)将矩阵H1和H2分别进行归一化处理,分别求取前k个最大的特征值及其对应的特征向量,并将所述两个视角各自的特征向量分别按列排成矩阵U1和U2;
(4)对每一个视角,将其Hessian矩阵沿着另一个视角获取的特征向量方向投影,从而获取聚类的有效信息,摒弃聚类无关信息,然后再投影回n维空间中,这样就得到了修正后的该视角的Hessian矩阵;
(5)将步骤(3)和(4)迭代规定的次数后,选取两个视角中具有代表性的最终修正的Hessian矩阵,求取前k个最大的特征值及其对应的特征向量,利用K-means方法聚类。
更具体地,所述不同视角是指同一图像的不同方面,可以是不同的颜色信息、形状信息,可以是高频分量和低频分量,也可以是两种不同特征提取方法获取的特征。
更具体地,步骤(1)还包括将提取的特征数据通过低通滤波去除高频噪声,以及对去噪后的数据进行降维和归一化处理。
更具体地,步骤(4)中,各视角Hessian矩阵的修正方法为:和其中sym(S)=(S+ST)/2,S1和S2分别是两个视角修正后的Hessian矩阵,符号T表示矩阵转置运算。
附图说明
图1所示为图像识别装置的工作流程图;
图2所示为本发明方法的流程图;
图3所示为本发明所采用的预处理方法的流程图;
图4所示为本发明所采用的Hessian正则处理的流程图;
图5所示为本发明所采用的相互投影及迭代过程的流程图。
具体实施方式
下面将结合附图对本发明进行详细说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省科学院情报研究所,未经山东省科学院情报研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611204912.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序