[发明专利]一种基于主动半监督字典学习的图像分类方法有效
申请号: | 202110286617.4 | 申请日: | 2021-03-17 |
公开(公告)号: | CN112861999B | 公开(公告)日: | 2023-09-19 |
发明(设计)人: | 杨猛;钟琴 | 申请(专利权)人: | 中山大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06N3/0895 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 刘俊 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主动 监督 字典 学习 图像 分类 方法 | ||
1.一种基于主动半监督字典学习的图像分类方法,其特征在于,包括以下步骤:
S1:获取训练样本集,将训练样本集分类为有标签样本集和无标签样本集;
S2:根据有标签样本集和无标签样本集构建初始的半监督字典模型;
S3:根据半监督字典模型分别构建有标签样本集和无标签样本集的判别表示;
有标签样本集的判别表示为:
其中,令表示有标签样本集,为类别个数,为第个类别的第个样本,为第个类别的样本数量;表示训练得到的半监督字典模型,为第个类别的子字典;为类共性表示系数矩阵,,是通过得到的类共性编码系数矩阵,,是样本特殊性编码系数向量,和均为标量;
无标签样本集的判别表示为:
其中,为第个无标签样本的类估计概率,满足且,为通过得到的编码系数向量,为标量;
S4:根据有标签样本集和无标签样本集的判别表示构建图像分类目标函数;构建得到的图像分类目标函数为:
其中,表示无标签样本的类别估计概率矩阵;表示无标签样本集通过半监督字典模型得到的判别表示编码系数矩阵;
S5:结合主动学习对图像分类目标函数进行更新,得到更新好的图像分类目标函数,将更新好的图像分类目标函数用于图像分类。
2.根据权利要求1所述的一种基于主动半监督字典学习的图像分类方法,其特征在于,通过基于注意力机制的标签估计算法得到的类估计概率,具体步骤为:
首先计算在每个子字典上的重构误差,得到的重构误差向量,再以相同的公式计算第个无标签样本的重构误差,得到的重构误差向量,
然后通过以下公式分别计算得到的自注意力值:
,
并通过以下公式计算第个无标签样本的类估计置信度:
最后通过以下公式计算的类估计概率:
其中,表示第个无标签样本与第个类别的第个有标签样本的自注意力值,表示第个无标签样本与第个无标签样本的自注意力值,,是一个常量,为无标签样本的数量。
3.根据权利要求2所述的一种基于主动半监督字典学习的图像分类方法,其特征在于,通过固定更新,固定更新,以及固定更新,从而更新图像分类目标函数;
其中,表示类共性表示系数矩阵,表示样本特殊性表示系数矩阵,表示无标签样本集通过半监督字典模型得到的判别表示编码系数矩阵。
4.根据权利要求3所述的一种基于主动半监督字典学习的图像分类方法,其特征在于,
当固定更新时,将图像分类目标函数简化为:
当固定更新时,将图像分类目标函数简化为标准的稀疏编码问题:
当固定更新时,将图像分类目标函数简化为:
。
5.根据权利要求3所述的一种基于主动半监督字典学习的图像分类方法,其特征在于,通过以下公式计算无标签样本集通过半监督字典模型得到对应的最优编码表示:
则无标签样本集对应的类别估计为:
其中,,是与类别相关的系数向量。
6.根据权利要求3所述的一种基于主动半监督字典学习的图像分类方法,其特征在于,半监督字典模型的更新具体包括以下步骤:
S5.1:预设标注预算;
S5.2:根据标注预算通过主动学习的度量策略函数从无标签样本集中选出待标注子集,并对待标注子集进行标记,得到有标签子集;
S5.3:根据有标签子集扩充有标签样本集和缩减无标签样本集;
S5.4:利用扩充后的有标签样本集和缩减后的无标签样本集更新半监督字典模型;
S5.5:判断是否达到迭代结束条件;
若是,则完成对半监督字典模型的更新;
若否,则返回步骤S5.2进行下一轮迭代。
7.根据权利要求6所述的一种基于主动半监督字典学习的图像分类方法,其特征在于,在步骤S5.2中,通过以下公式选出top-K个待标记的无标签样本组成待标注子集:
。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110286617.4/1.html,转载请声明来源钻瓜专利网。