[发明专利]结合主动学习的四分类器协同训练方法无效
申请号: | 201110257571.X | 申请日: | 2011-09-01 |
公开(公告)号: | CN102324046A | 公开(公告)日: | 2012-01-18 |
发明(设计)人: | 杨利英;王轶初;韩玉想;盛立杰 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/66 | 分类号: | G06K9/66 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 程晓霞;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种结合主动学习的四分类器协同训练方法,涉及结合主动学习的协同训练,属于机器学习技术领域。本发明在实现过程中使用了四个分类器,及主动学习,对协同训练方法作了进一步的改进。本发明由于采用四个分类器进行协同训练,将三个分类器的判决都一致的样本直接添加到训练集中,可以保证在提高未标记样本置信度的同时,避免引入过多噪声;本发明由于针对难分样本进行主动学习,提高了学习的效果,同时对这类样本的妥善处理有助于修正各分类器的识别函数;本发明由于将三个分类器的判决都不一致的样本作为难分样本,使得进行主动学习的条件要求较高,且实现简单。本发明适用于诸如网页分类、图象处理、人脸识别、入侵监测等应用领域。 | ||
搜索关键词: | 结合 主动 学习 分类 协同 训练 方法 | ||
【主权项】:
结合主动学习的四分类器协同训练方法,其特征在于:采用四个分类器进行协同训练并结合主动学习技术提高半监督学习性能,操作步骤包括:(1)选取对数据集敏感的学习算法L;(2)针对给定的未标记数据集Du、已标记数据集(初始训练集)D1、测试集T及学习算法L,对D1运用Bootstrap技术抽取四次,得到样本数等于|D1|的四个训练集S1,S2,S3,S4,用算法L对四个训练集分别训练出分类器C1,C2,C3,C4;(3)对于任一个由算法L训练出的分类器Ci(i=1,2,3,4),维护其独自的训练集Si(i=1,2,3,4),将满足{x|x∈Du,且Cj(x)=Ck(x)=Cm(x),j,k,m≠i}的无标记样本x加入到Si中,将满足{x|x∈Du,且Cj(x)≠Ck(x)≠Cm(x),j,k,m≠i}的无标记样本x,由主动学习对无标记样本x进行标记后也加入到Si中,遍历完Du后,得到更新后的Si’;(4)对于每个分类器Ci(i=1,2,3,4),若|Si′|>|Si|,则对Ci利用训练集Si’重新训练,得到分类器Ci’;(5)对于每个分类器Ci,若Ci’≠Ci,则转步骤(3),直到四个分类器都不再更新为止;(6)最终的判决结果由四个分类器的判决结果组合而成,输出分类的错误率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110257571.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种防虹吸快开滑块式节水马桶
- 下一篇:味觉阻断中药饮药器