[发明专利]一种融合组稀疏约束和图趋势过滤的噪声容错多标签分类方法有效
申请号: | 202010411275.X | 申请日: | 2020-05-15 |
公开(公告)号: | CN111626344B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 许磊;陈蕾;李伟泽;宋传承;林腾涛 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210012 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 稀疏 约束 趋势 过滤 噪声 容错 标签 分类 方法 | ||
1.一种融合组稀疏约束和图趋势过滤的噪声容错多标签分类方法,其特征在于,包括以下步骤:
(1)抽取训练集样本数据的特征表示,训练集中的每个样本都带有事先标注好的语义标签,并基于特征数据以及标签数据建立融合组稀疏约束和图趋势过滤的噪声容错多标签分类数学模型;
(2)通过ADMM算法求解提出的数学模型,得到分类器;
(3)基于步骤(2)中学得的分类器,预测未知样本的标签向量;
所述步骤(1)包括以下步骤:
(11)定义与Y=[y1;y2;...;yi;...;yn]∈{0,1}n×c分别为输入的多标签特征数据以及标签数据,其中xi为维度为d的第i个样本的特征向量,yi表示维度为c的第i个样本的标签向量;如果样本带有某个标签,则其标签向量中的对应元素为1,反之为0;对于任意矩阵定义其L1范数,L2范数以及L2,1范数如下:
(12)建立融合组稀疏约束和图趋势过滤的噪声容错多标签分类模型如下:
其中,为基于组稀疏约束的线性回归损失函数,和为特征选择项,为图趋势过滤正则化项,λ、η和μ为正则化项参数,和为权重矩阵,且Q作为分类器被用于预测样本标签。
2.根据要求1所述的一种融合组稀疏约束和图趋势过滤的噪声容错多标签分类方法,其特征在于,步骤(12)所述的的构造过程如下:
定义相似度矩阵利用高斯核函数计算两个样本特征之间的关联性,则A中第i行第j个元素ai,j的计算方法定义如下:
其中,ai,j代表xi和xj之间的相似度,ξ为高斯核宽度;
对于A中的第i行ai=[ai,1,ai,2,...,ai,n],定义前k个最大的值所对应的样本的特征向量与xi相似,并用关联矩阵S∈{-1,0,1}ε×n记录所有样本之间特征的相关性信息,其中,ε为关联对的数量;若xi与xj相似,则在S中增加一行记录,令该行的第i个元素为-1,第j个元素为1,行内其他元素为0;
基于关联矩阵S定义基于组稀疏约束的图趋势过滤正则化项如下:
和用于学习标签共有特征以及标签特有特征,且
3.根据要求2所述的一种融合组稀疏约束和图趋势过滤的噪声容错多标签分类方法,特征在于,所述步骤(2)包括以下步骤:
(21)将各正则化项代入公式(4),并将其转化成如下增广拉格朗日函数形式:
其中,ρ为惩罚因子,为拉格朗日乘子;
(22)利用随机数初始化M、Q、W、U,对多标签数据进行归一化处理;
(23)设定最大迭代次数T,迭代求解M、Q、W、U,直至达到最大迭代次数T,或是目标函数收敛,即第t次迭代所对应的目标函数的值与第t-1次迭代所对应的目标函数的值之差小于10-3时,迭代完成;此时所得到的M、Q、W即为公式(12)的解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010411275.X/1.html,转载请声明来源钻瓜专利网。