[发明专利]一种针对低维数据样本筛选的支持向量机加速方法及装置在审

专利信息
申请号: 201810942190.7 申请日: 2018-08-17
公开(公告)号: CN109117887A 公开(公告)日: 2019-01-01
发明(设计)人: 王宏志;刘昕源;高宏 申请(专利权)人: 哈尔滨工业大学
主分类号: G06K9/62 分类号: G06K9/62;G06N99/00
代理公司: 北京格允知识产权代理有限公司 11609 代理人: 周娇娇;李亚东
地址: 150001 黑龙*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 支持向量机训练 支持向量机 样本 分类边界 低维 筛选 数据样本 训练样本 网格 数据处理技术 边界样本 分类问题 计算过程 区域边界 原始样本
【说明书】:

发明涉及数据处理技术领域,提供了一种针对低维数据样本筛选的支持向量机加速方法及装置,该方法包括:对原始样本的区域边界进行逐级的网格划分,并确定分类边界;根据分类边界选取边界样本,作为筛选后的训练样本;使用所述筛选后的训练样本进行支持向量机的训练。本发明针对低维数据的分类问题,对给定样本进行网格划分,找到分类边界处的样本,并把他们提取出来,得到有效的支持向量机训练样本,最大程度上减少参与下一步实际的支持向量机训练的无效样本,实现了对支持向量机训练计算过程的加速。

技术领域

本发明涉及数据处理技术领域,尤其涉及一种针对低维数据样本筛选的支持向量机加速方法及装置。

背景技术

支持向量机(SVM:SupportVectorMachine)是基于统计学习理论中结构风险最小化原理而提出的一种学习算法。能有效避免过学习、维数灾难、局部极小等问题,以其坚实的理论基础和良好的泛化性能而被广泛应用于机器学习的诸多领域。然而,经典的支持向量机训练,本质上是二次规划问题(QP)的求解,而标准二次规划问题(QP)求解算法的时间复杂度是O(N3),所以当样本集数量规模较大时,需要较多的训练时间和存储空间。正是由于支持向量机的训练算法复杂度随求解问题规模的增大呈指数增长、计算量大、训练速度慢,支持向量机不适宜大规模数据问题的应用,成为影响支持向量机发展的主要因素。

目前,对于数据集中的缺失值的解决办法大致分为以下几种:

(1)分解算法;该方法解决了算法空间复杂度高的问题,但对于具有较多支持向量的大规模问题,仍存在收敛速度慢的缺陷。

(2)随机提取样本算法;该方法由于采用随机提取训练样本的方式,使用的样本有效信息较少,所以训练出来正确率有所降低;

(3)预提取训练样本方法;该方法是以某种距离特征为基础,提取位于分类边界附近的训练样本,对样本的分布密度、分布边界形状较为敏感,算法中的参数也需人为设定,自适应能力较低。

发明内容

本发明要解决的技术问题在于,针对现有技术的上述一个或多个的缺陷,提供了一种针对低维数据样本筛选的支持向量机加速方法及装置。

为了解决上述技术问题,本发明提供了针对低维数据样本筛选的支持向量机加速方法,包括:

边界确定步骤、对原始样本的区域边界进行逐级的网格划分,并确定分类边界;

样本筛选步骤、根据分类边界选取边界样本,作为筛选后的训练样本;

样本训练步骤、使用所述筛选后的训练样本进行支持向量机的训练。

可选地,所述边界确定步骤包括:

1)将原始样本的区域边界作为当前检测区域;

2)将当前检测区域平均划分成四个网格,并对每个网格执行以下分类边界检测操作:

a.判断当前网格的样本数是否低于预设最低样本数,是则将当前网格的样本全部记为边界样本,并结束对当前网格的检测,转步骤f;否则选取当前网格与下一相邻的网格,并转步骤b;

b.判断这两个相邻的网格为双样网格还是单样网格,所述双样网格为同时包含两类样本的网格,所述单样网格为只含有一类样本的网格;若这两个相邻的网格均为单样网格,则转步骤c;若这两个相邻的网格中一个为单样网格一个为双样网格,则转步骤d;若这两个相邻的网格均为双样网格,则转步骤e;

c.判断这两个相邻的网格中各自包含的样本是否属于同一类样本,是则确定这两个相邻的网格中无分类边界,否则确定这两个相邻的网格之间的边界为分类边界;

d.提取双样网格中距离相邻网格边界最近的k个样本,如果均与单样网格中样本属于同一类,则确定这两个相邻的网格中无分类边界,否则确定所述相邻网格边界为分类边界;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810942190.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top