[发明专利]一种高效的SVM主动半监督学习算法在审
申请号: | 201410523303.1 | 申请日: | 2014-10-08 |
公开(公告)号: | CN104318242A | 公开(公告)日: | 2015-01-28 |
发明(设计)人: | 徐海龙;别晓峰;龙光正;冯卉;吴天爱;白东颖;郭蓬松;史向峰;田野;高歆 | 申请(专利权)人: | 中国人民解放军空军工程大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京世誉鑫诚专利代理事务所(普通合伙) 11368 | 代理人: | 郭官厚 |
地址: | 710071 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 高效 svm 主动 监督 学习 算法 | ||
1.一种高效的SVM主动半监督学习算法,其特征在于,包括以下步骤:
(一)、在已标记训练样本集L上训练初始的SVM分类器
(二)、判断初始的SVM分类器是否满足学习终止条件Sstop,若满足,则结束SVM训练学习;若不满足,则转到步骤(三);
(三)、使用初始的SVM分类器对未标记样本U进行预测标注;
(四)、对未标记样本U中预测标注置信度大于阈值的样本进行基于Tri-training的半监督学习,并将半监督学习所选择的样本加入已标记训练样本集L;
对未标记样本U中预测标注置信度小于阈值的样本进行基于QBC的主动学习,并将主动学习所选择的样本加入已标记训练样本集L;
(五)、在更新的已标记训练样本集L上训练SVM分类器
(六)、重复步骤(二),直至训练的SVM分类器满足主动学习的终止条件Sstop。
2.根据权利要求1所述的高效的SVM主动半监督学习算法,其特征在于,在步骤(一)中,在训练学习的初始阶段,训练初始的SVM分类器采用如下的加权SVM:
SVM分类器fsvm原始最优化问题为:
式中,si表示对不同样本的权重,λi为类yi的权重;
SVM分类器fsvm对偶问题为:
SVM分类器fsvm分类决策函数为:
确定加权SVM的权重系数采取如下方法:
2a、在SVM主动学习训练的初始阶段,每个样本的权重参数si都相同,取si=1/n,构造初始分类器
2b、在初始分类器的基础上,随着SVM主动学习过程的进行,进行第k(k=1,2,…)次采样,对候选样本集U使用分类器,从候选样本集中根据选择距离超平面最近的m个样本作为增量样本标记后加入到训练集中,并对新的训练集使用分类器,寻找此时分类间隔中的正负例样本,令分类间隔中的样本的权重参数大于分类间隔外的样本的权重参数,正负例样本的类别权重参数与分类间隔中的正负例样本数成反比,然后进行SVM主动学习进程,并训练
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军空军工程大学,未经中国人民解放军空军工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410523303.1/1.html,转载请声明来源钻瓜专利网。