[发明专利]基于线性支持向量机的分类方法及装置在审
申请号: | 201310746140.9 | 申请日: | 2013-12-30 |
公开(公告)号: | CN104750734A | 公开(公告)日: | 2015-07-01 |
发明(设计)人: | 兰亮;曾嘉;袁明轩 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘芳 |
地址: | 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 线性 支持 向量 分类 方法 装置 | ||
本发明实施例提供一种基于线性支持向量机的分类方法及装置。本发明基于线性支持向量机的分类方法,包括:获取训练数据中各样本点的贡献值,所述贡献值表示所述样本点对获取线性支持向量机SVM模型的重要程度;根据所述各样本点的贡献值选取所述训练数据中部分样本点进行目标函数优化,确定所述线性SVM模型;根据所述线性SVM模型,预测对测试数据的分类结果。本发明实施例根据训练数据中各样本点对获得线性SVM的模型的贡献大小,确定子训练数据,并根据此子训练数据确定线性SVM的模型,加快线性SVM算法的收敛速度。
技术领域
本发明实施例涉及数据处理技术,尤其涉及一种基于线性支持向量机的分类方法及装置。
背景技术
由于处理实际问题中分类效果的显著,支持向量机(Support Vector Machine,简称:SVM)被广泛的应用到现实生活中的各种分类问题,例如,SVM被用于图像识别,推荐系统或文本分类等。SVM包括线性SVM和非线性SVM,其中,相比于非线性SVM的求解需要O(N
目前,线性SVM算法主要包括:(1)基于随机梯度下降(Stochastic GradientDescent,简称:SGD)的Pegasos开源软件包;(2)基于坐标下降(Dual Coordinate Descent,简称:DCD)方法解决SVM的对偶问题的Liblinear开源软件包。上述两种方法都是在线性的时间复杂度中训练得到线性SVM模型。但随着数据样本量和维度的大幅增加,其获取线性SVM模型的时间复杂度将成为线性SVM应用的一个瓶颈。
发明内容
本发明实施例提供一种基于线性支持向量机的分类方法及装置,以解决现有线性SVM算法收敛速度慢的问题。
第一方面,本发明实施例提供一种基于线性支持向量机的分类方法,包括:
获取训练数据中各样本点的贡献值,所述贡献值表示所述样本点对获取线性支持向量机SVM模型的重要程度;
根据所述各样本点的贡献值选取所述训练数据中部分样本点进行目标函数优化,确定所述线性SVM模型;
根据所述线性SVM模型,预测对测试数据的分类结果。
结合第一方面,在第一方面的第一种可能的实现方式中,所述获取训练数据中各样本点的贡献值,包括:
根据所述训练数据中各样本点和预设参数,获取所述训练数据中各样本点的贡献值。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述根据所述训练数据中各样本点和预设参数,获取所述训练数据中各样本点的贡献值,包括:
根据如下公式获取所述训练数据中各样本点的贡献值:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310746140.9/2.html,转载请声明来源钻瓜专利网。