[发明专利]一种半监督的多类别Boosting分类方法在审
申请号: | 202011075826.6 | 申请日: | 2020-10-10 |
公开(公告)号: | CN112232398A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 许淑华;齐鸣鸣 | 申请(专利权)人: | 温州大学瓯江学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 绍兴市寅越专利代理事务所(普通合伙) 33285 | 代理人: | 邓爱民 |
地址: | 325000*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监督 类别 boosting 分类 方法 | ||
1.一种半监督的多类别Boosting分类方法,其特征在于:内容包括如下步骤:
步骤1:把数据集划分为若干个子模块,其中数据集包括标签数据集和无标签数据集;
步骤2:在数据集上逐列更新边距目标向量;
步骤3:在每个图像块集合上计算稀疏模块化字典;
步骤4:在每个图像块集合上利用基于边距回归目标的模块化稀疏表示学习计算图像块之间的相似性;
步骤5:利用sigmoid加权投票算法把每个图像块集合上学习的相似性结果组合成一个整体;
步骤6:根据相似性置信度对无标签数据进行伪标签的分配,按照置信度大小选择一些无标签数据加入训练样本集中并对弱分类器进行训练,训练完后把弱分类器组合成最终的分类器;
步骤7:利用最终的分类器完成测试样本的分类。
2.根据权利要求1所述的一种半监督的多类别Boosting分类方法,其特征在于:所述步骤1中将数据集X划分为M个子模块,其中包含nl个标签数据集和nu个无标签数据集,标签数据集表示为无标签数据集表示为
3.根据权利要求2所述的一种半监督的多类别Boosting分类方法,其特征在于:所述步骤2中在数据集上逐列更新边距目标向量的内容包括以下步骤:
输入:数据集X、字典D、真实的类标签编号c,其中c∈{1,...,1,2,...,2,...,C,...,C},C为数据的总类别数目;
步骤2.1:设表达式如下:W=DTX,gj=Wj+1-Wc,其中Wj表示W的第j列,Wc表示W的第c列,用ζ表示学习因子,t和j均表示变量,令ζ=0,t=0,j=1,其一阶导数
步骤2.2:当j≤C循环;
若j≠c,
若ψ′(ζ)>0,则ζ=ζ+gj,t=t+1;
j=j+1;
步骤2.3:ζ=ζ/(1+t);
步骤2.4:通过下式逐列更新边距目标向量S的第j列,即Sj:
其中,Ω(·)表示索引运算符。
输出:边距目标向量S。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学瓯江学院,未经温州大学瓯江学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011075826.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种煤气脱硫钠盐提纯系统及方法
- 下一篇:一种河流漂浮式水污染处理装置