[发明专利]面向大规模训练数据的SVM主动学习分类算法在审
申请号: | 201410665206.6 | 申请日: | 2014-11-20 |
公开(公告)号: | CN104331716A | 公开(公告)日: | 2015-02-04 |
发明(设计)人: | 刘福江;林伟华;徐战亚;郭艳;黄彩春;郭振辉 | 申请(专利权)人: | 武汉图歌信息技术有限责任公司 |
主分类号: | G06K9/66 | 分类号: | G06K9/66 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 刘焓 |
地址: | 430074 湖北省武汉市*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及遥感分类与图像形象信息处理技术的交叉领域,尤其涉及面向大规模训练数据的SVM主动学习分类算法。本发明方法基于聚类和不确定性评价方法,在大量样本中选取出距离聚类质心较远、距离两类分界面又较近的边界样本,通过引入主动学习的方法,进行分类器的迭代优化。边界样本选择的过程不是盲目的,而是科学的,通过迭代学习系统不断地比较样本的不确定性信息和分布信息的差别,并根据比较结果,自动地控制和调整压缩集,反演推导出最优的训练样本集合,完成遥感影像的自动分类,提高分类的质量。 | ||
搜索关键词: | 面向 大规模 训练 数据 svm 主动 学习 分类 算法 | ||
【主权项】:
一种基于主动学习方法选取样本的改进SVM分类器,其特征在于,其方法包括以下步骤:步骤a)、首先对海量机器标记样本进行聚类分析,选取各类别的聚类中心部分样本作为初始压缩集A,计算样本到聚类质心的距离d、聚类半径r、聚类内离散度,选取聚类模糊样本作为训练样本集B{b1,b2,b3,b4,b5……bn};步骤b)、使用初始压缩集训练SVM分类器,并用该分类器对训练样本集(i=1,2…n)进行分类, 计算分类器分类精度,并挑选出分类结果中的误分样本,用当前分类模型对每个样本的类别进行预测,然后使用不确定性阈值判断法从误分样本中进一步挑选出靠近分类超平面的边界样本;步骤c)、将边界样本加入到初始压缩集A中,迭代进行步骤b),直到分类精度保持在较高的水平停止迭代,输出优化后的SVM分类器。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉图歌信息技术有限责任公司,未经武汉图歌信息技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410665206.6/,转载请声明来源钻瓜专利网。
- 上一篇:进出室系统
- 下一篇:一种具有噪声鲁棒性的人脸表情识别方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置