[发明专利]结合多源特征学习和组稀疏约束的无监督物体识别方法有效
申请号: | 201811471683.3 | 申请日: | 2018-12-04 |
公开(公告)号: | CN109670418B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 曾志强;王晓栋;严菲;陈玉明 | 申请(专利权)人: | 厦门理工学院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06F17/16 |
代理公司: | 泉州市潭思专利代理事务所(普通合伙) 35221 | 代理人: | 麻艳 |
地址: | 361024 福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结合 特征 学习 稀疏 约束 监督 物体 识别 方法 | ||
本发明公开一种结合多源特征学习和组稀疏约束的无监督物体识别方法,包括如下步骤:步骤1,从包含c个类别的待处理图像集中获取V种视图,并将其组成数据集X=[x1,x2,…,xn]∈Rd×n,其中d代表数据的特征维度,n代表数据集的样本数;步骤2,提取数据集X的总散度矩阵St;步骤3,在步骤2的基础上构建基于线性判别分析的KM聚类模型;步骤4,在步骤3的基础上构建基于组稀疏约束和特征选择的多源数据联合聚类模型;步骤5,求解步骤4得到的多源数据联合聚类模型的目标函数,并进行优化。此种方法可以提高聚类方法的准确度,可快速定位最优特征子集,还可有效抑制数据集中的噪声干扰,最终为机器学习、计算机视觉相关应用提供有效支持。
技术领域
本发明属于机器学习技术领域,特别涉及一种结合多源特征学习和组稀疏约束的无监督物体识别方法。
背景技术
聚类技术旨在将待处理对象划分为多个相似的簇,进而提取数据的抽象语义,是应用非常广泛的一项技术,在图像物体识别领域中获得了巨大的成功。然而,传统图像物体识别领域中的聚类方法还存在以下缺陷:首先,图像数据一般由高维特征组成,这些高维图像数据中往往包含噪声特征,直接对其操作将严重影响聚类效果;其次,这些高维图像数据一般存在大量冗余特征,处理这类数据需要消耗昂贵的计算资源。在多媒体技术高速发展的今天,高维图像数据呈现爆发式增长,给传统聚类方法带来了巨大挑战。最新研究表明,若能有效选择数据最优特征子集,将能有效提高图像识别的准确率。
互联网技术的快速增长,扩大了数据收集来源的多样性,也使得数据特征呈现多源化。不同类型数据特征拥有不同的性质,其在图像识别应用中也发挥着不同的作用。为有效处理这些多源高维数据,现有的方法一般借助子空间学习和多视图学习,以获得高维数据在不同视图上的最优特征子空间。然而,这些方法需要借助降维方法定位特征子空间,其所获取的子空间与原始空间存在较大差异,很难满足实际应用中对数据语义理解的需求。另外,为处理多视图数据,这类方法需要单独确定每个视图的最优子空间,当视图数量增加时,其子空间搜索的复杂度将会陡然上升。
发明内容
本发明的目的,在于提供一种结合多源特征学习和组稀疏约束的无监督物体识别方法,使得聚类方法能够高效利用多源数据特征间的相互关系和共享特征子空间,以提高聚类方法的准确度;利用组稀疏技术约束多源数据的联合特征选择矩阵,对联合特征进行综合排序,进而可快速定位最优特征子集;其还可有效抑制数据集中的噪声干扰,最终为机器学习、计算机视觉相关应用提供有效支持。
为了达成上述目的,本发明的解决方案是:
一种结合多源特征学习和组稀疏约束的无监督物体识别方法,包括如下步骤:
步骤1,从包含c个类别的待处理图像集中获取V种视图,并将其组成数据集X=[x1,x2,…,xn]∈Rd×n,其中d代表数据的特征维度,n代表数据集的样本数;
步骤2,提取数据集X的总散度矩阵St;
步骤3,在步骤2的基础上构建基于线性判别分析的KM聚类模型;
步骤4,在步骤3的基础上构建基于组稀疏约束和特征选择的多源数据联合聚类模型;
步骤5,求解步骤4得到的多源数据联合聚类模型的目标函数,并进行优化。
上述步骤2中,提取数据集的总散度矩阵St的公式是:
其中,为数据集样本的总平均值。
上述步骤3中,KM聚类模型的目标函数如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门理工学院,未经厦门理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811471683.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:指纹识别方法及装置
- 下一篇:一种基于周界安防视频监控系统的行人检测方法