[发明专利]基于拒识子空间的分层支持向量机分类方法有效
申请号: | 201310390468.1 | 申请日: | 2013-08-30 |
公开(公告)号: | CN103473556A | 公开(公告)日: | 2013-12-25 |
发明(设计)人: | 徐贵标;胡包钢 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 梁爱荣 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于拒识子空间的分层支持向量机分类方法,适用于处理多类别或非平衡大数据分类问题;该方法采用拒识子空间的方式对大数据实现分层并行化处理,从而改善分类结果;该方法的步骤是:首先训练获得计算复杂度低的支持向量机;然后用互信息学习准则确定支持向量机的拒识子空间,进而获得原始训练集中的拒识训练集;然后在拒识训练集上训练高精度的支持向量机用于进一步判别拒识训练集;上述训练过程根据实际需求重复多次。本发明通过分而治之的思想降低每一层支持向量机的训练复杂度;通过互信息让数据自身确定最佳的拒识子空间;因此,本发明具有计算复杂度低和让数据说话等特点,应用于医学诊断、多类别物体检测等大数据分类领域。 | ||
搜索关键词: | 基于 拒识子 空间 分层 支持 向量 分类 方法 | ||
【主权项】:
一种基于拒识子空间的应用于非平衡大数据分类的分层支持向量机分类方法,其特征在于,该分类方法包括如下的步骤:步骤S1:将数据集按照比例分为训练数据集和验证数据集;确定分层支持向量机的总层数h;步骤S2:根据训练数据集规模为支持向量机层叠训练法选择核函数,并利用支持向量机层叠训练法在训练数据集上训练第k层支持向量机,k表示某一分层的支持向量机;步骤S3:在验证数据集上,利用基于互信息的代价缺失学习获得第k层支持向量机的正负类样本拒识阈值,进而确定第k层支持向量机的拒识子空间;步骤S4:利用第k层支持向量机的拒识子空间分别在训练数据集上和验证数据集上筛选出拒识训练数据集和拒识验证数据集,筛选出的拒识训练数据集和拒识验证数据集分别是下一层支持向量机的训练数据集和验证数据集,利用筛选出的训练数据集和验证数据集重复执行步骤S2至步骤S4,直到分层支持向量机的层数达到总层数h,则执行步骤S5;步骤S5:给定一个测试样本,根据分层支持向量机的层次结构判定其类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310390468.1/,转载请声明来源钻瓜专利网。
- 上一篇:基于SVM的医学影像分类方法
- 下一篇:微通道管的图像识别系统