[发明专利]一种基于子空间投影和字典学习的图像分类方法有效
申请号: | 201810677726.7 | 申请日: | 2018-06-27 |
公开(公告)号: | CN109117860B | 公开(公告)日: | 2022-10-25 |
发明(设计)人: | 吴松松;邱宇峰;姚礼昕;荆晓远;岳东 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/77 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 牛莉莉 |
地址: | 210023 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 空间 投影 字典 学习 图像 分类 方法 | ||
1.一种基于子空间投影和字典学习的图像分类方法,其特征在于:包含以下步骤:
步骤1)使用带标签的训练集初始化判别字典并给测试集样本加上伪标签,包括如下步骤:
步骤1.1)用带标签的训练集样本,通过线性判别字典学习的方法来初始化判别字典D(0),
步骤1.2)学习到字典D(1)后,给测试集样本加上伪标签,给第i个测试集样本加伪标签;
步骤2)选出具有高可信度的测试集样本,详细步骤如下:
由步骤1.2)给第i个测试集样本加上伪标签之后,通过计算每个训练集样本的置信度来衡量伪标签的可信度;
在第k轮迭代过程中,第i个样本被分类到第j类的置信度由式(3)定义:
即对第i个测试集样本,现得到长度为C的向量其值除了伪标签所属的项外都为零,即若共有C=5类,第i个样本伪标签为2,则其中为使用第k轮学习到的字典中的第j类子字典重建第i个测试集样本的重建误差,即在第k轮迭代学习到更新后的字典后,分别使用第j个子字典来重建第i个测试集样本,由式(4)给出:
其中是将测试集样本投影到低维子空间的投影矩阵;
为了得到伪标签可信度最大的Q%*Nt个测试集样本,以置信度为依据选择矩阵挑出所有类样本中可信度最大的前Q%个样本,W的每一个元素,即为零一变量,指出第i个样本在挑选第j类时是否被选中,若被选中则为1,否则为0,其中Q是一个固定常数,根据训练集大小而定,取50%;
挑选第j类样本的方法如式(5):
s.t.||Wj(k)||0=Q%*Nt,j=1,…,C (5)
其中是第j类样本的选择矩阵,它是一个对角矩阵,其对角线上的元素为选择矩阵第j列的元素;同样地,也是对角矩阵,其对角线上的元素是置信度矩阵C(k)的第j列;||Wj(k)||0是Wj(k)矩阵中非零元素的个数,即确保每一类中只有Q%被选出;
至此得到每一类的选择矩阵Wj(k),通过式(6)将选出的每一类高可信度样本加入字典的训练过程中,即更新用于下一轮训练的测试集样本:
Yj(k+1)=[YtWj(k)],j=1,…,C (6);
步骤3)将高可信度的测试集样本和训练集样本分别投影到低维平面上,在低维平面上学习判别字典,同时联合学习投影矩阵,包括如下具体步骤:
步骤3.1)假设投影矩阵和n为投影后子空间的维数,则投影到低维子空间上后的训练集样本为测试集样本为
在这个低维平面上利用式(7)训练集样本和挑选之后的测试集样本学习字典,并联合学习投影矩阵Ps和Pt
且||xj||0≤T0,T0为稀疏系数
其中即将两个投影矩阵邻接在一起,同理
其次,即将Ys和Yt作为块矩阵的对角,其余的块矩阵为零,Trace指矩阵的迹,即矩阵主对角线上元素之和;
f1使用利用PsPt将分别将训练集样本和测试集样本投影到低维子空间中,并在低维子空间中联合学习判别字典D和‖·‖0指矩阵或向量的零范数,即向量中非零元素的个数,‖·‖F指矩阵的Frobenius范数,即指矩阵各元素平方和开平方;
f2是训练集样本和测试集样本的最大均值距离(MMD),衡量了训练集样本和测试集样本在分布上的差异,分布差异越小,f2的取值越接近0;其中矩阵由式(8)给出:
f3是将样本反投影的过程,期望在投影过程中损失尽可能少的样本信息;
步骤3.2)在求解式(7)的优化问题时引入矩阵和B,分别满足:
式(7)的优化方程可转换为:
且||xj||1≤T0,T0为稀疏系数
经过整理式(12)可得到:
需要求的变量有三个,在这里本发明采取固定其他先求其中一个的策略,即先固定求再迭代固定求当被固定时,它们可被看作常数,固式中只剩下为未知量;
首先将初始化,方法是:
先将K进行特征值分解得到:
K=VSVT (14)
其中,V是特征向量矩阵,S是一个对角矩阵,其对角线上的元素是矩阵K的特征值,本方法将ks及kt的列向量初始化为前n大的特征值所对应的特征向量,即对特征值从大到小排列之后,选取最大的前n个特征值对应的特征向量构成或这里的n是将为后平面的维数;
在得到的初始值后,式中还有未知量和由于
未知量可转换为D和我们利用多次迭代的方法求解,求解D和的具体步骤如下:
将D初始化为随机的单位向量,则式中只剩下为未知量,先将初始化为全O向量再采取逐列更新的方式来计算为第i类样本系数表示的稀疏系数;
在第h轮中,更新的公式为:
其中,是第h轮更新得到的稀疏系数,是函数Q(x)对的偏导数,其中,Q(X)由下式给出:
由式(15)解得后,固定式中的同样利用逐列更新的方法来求解D,即每次更新字典D中的一列dj,更新dj的公式为:
其中,Z是经过投影的样本即
至此,求得了D(k)和利用下式求出
则固定和求解
由式(13)(14)可令:
可将式(13)转换为如下的形式:
{G}=arg minGtrbce(GTHG) (17)
其中G=[Gs,Gt],式(16)需要利用Stiefel流形来求解,可直接调用现成的软件包,求得G;
至此得到更新的公式为:
可由式(9)和(10)分别解出Ps和Pt,
至此,已由式(16)求得D(k),由式(9)和(10)分别解出Ps和Pt
步骤4)使用学习到的判别字典再次对测试集样本进行分类,即重新加上伪标签;
步骤5)计算稳定样本个数,若其数量大于等于测试集样本数量的80%则结束迭代过程,输出该轮伪标签作为结果;若小于80%则重复步骤2) ~4) 直到满足条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810677726.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:监测风力发电机叶片结冰的方法及装置
- 下一篇:图像标签识别方法、装置及服务器