[发明专利]基于DDAG的SVM多类分类主动学习算法在审
申请号: | 201510155787.3 | 申请日: | 2015-04-02 |
公开(公告)号: | CN104751182A | 公开(公告)日: | 2015-07-01 |
发明(设计)人: | 徐海龙;别晓峰;龙光正;申晓勇;辛永平;郭蓬松;王磊;王欢;冯卉;张建新;吴天爱;田野;史向峰;高歆 | 申请(专利权)人: | 中国人民解放军空军工程大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N5/04 |
代理公司: | 北京世誉鑫诚专利代理事务所(普通合伙)11368 | 代理人: | 郭官厚 |
地址: | 710000 *** | 国省代码: | 陕西;61 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本发明公开了一种基于DDAG的SVM多类分类主动学习算法,在多类SVM训练学习过程中引入主动学习思想,充分利用传统“一对多”或“一对一”多类分类方法在测试样本时存在大量的不可分点或决策盲区的缺点,提出了一种基于“o-v-o”分类决策盲区的主动学习算法,主动选择这些不可分或决策盲区中对当前学习器来说就是“最不确定性”的样本,针对主动学习中仅使用单一主动学习策略存在的局限性,在多类SVM训练学习中提出一种基于后验概率及相似度度量不确定性多策略融合的主动学习方法,并将这两种主动学习方法有效得进行了融合,减小了SVM训练学习中的样本标记规模,减少学习的样本标记代价,以尽可能少的标记样本训练获得性能尽可能高的SVM分类器。 | ||
搜索关键词: | 基于 ddag svm 分类 主动 学习 算法 | ||
【主权项】:
基于DDAG的SVM多类分类主动学习算法,其特征在于,包括以下步骤:步骤1:在样本集上训练K(K?1)/2个二类SVM分类器记所有SVM二分类器组成的多分类器为其中,i=1,2,…,K,j=1,2,…,K,i≠j,L为已标记样本集,K为类别数,t=1;步骤2:判断SVM多分类器是否满足学习的终止条件Sstop,若满足则输出并结束训练,否则转到步骤3;步骤3:判断未标记或候选样本集U是否为空,若是,输出并结束训练;否则,先对未标记或候选样本用进行预先标记,然后根据基于o?v?o分类决策盲区的主动学习算法,从未标记或候选样本集U中选择出对SVM训练最有利的未标记样本集并令U=U-ItMC;]]>步骤4:将样本集人工进行正确标记,并将其加入标记样本集,有在更新的训练样本集L上使用SVM主动增量学习算法AlISVM仅对对应类样本发生变化的分类器重新训练,并更新分离性测度矩阵SMH中训练样本发生变化的类所对应的分离性测度;判断分类器是否达到终止条件Sstop,若满足则输出并结束训练,否则转到步骤5;步骤5:对未标记样本x,x∈U,分别计算样本x的不确定性度UnM(x)、样本x与Lx的相似度dcos(x,Lx)、样本x与Ux的相似度dcos(x,Ux),所述Lx为与x同类的标记样本集,所述Ux为与x同类的未标记样本集,选择m个满足UnM(x)≤UnMth、dcos(x,Lx)≤dmax及dcos(x,Ux)≥dmin的样本,并记为其中,m为每次采样的样本数,UnMth为不确定性阈值,dmax和dmin为样本相似度阈值;步骤6:将样本集人工进行正确标记,并将其加入标记样本集,有在更新的训练样本集L上使用SVM主动增量学习算法AlISVM仅对对应类样本发生变化的分类器重新训练,并更新分离性测度矩阵SMH中训练样本发生变化的类对应的分离性测度;令t=t+1,并转到步骤2,直至训练结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军空军工程大学,未经中国人民解放军空军工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510155787.3/,转载请声明来源钻瓜专利网。