[发明专利]基于capped-l1范数的提高TWSVM算法鲁棒性的方法在审
申请号: | 201810622213.6 | 申请日: | 2018-06-15 |
公开(公告)号: | CN108846437A | 公开(公告)日: | 2018-11-20 |
发明(设计)人: | 业巧林;王春燕 | 申请(专利权)人: | 南京林业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/16 |
代理公司: | 淮安市科文知识产权事务所 32223 | 代理人: | 廖娜;李峰 |
地址: | 210037 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类平面 矩阵 算法鲁棒性 范数 数据处理领域 原始数据矩阵 单位矩阵 对角矩阵 正负数据 初始化 对角阵 鲁棒性 数据集 野值点 算法 更新 | ||
本发明涉及数据处理领域,公开了一种基于capped‑l1范数的提高TWSVM算法鲁棒性的方法,包括:输入原始数据矩阵M和参数C1、C2、ε1和ε2;M分为正负数据矩阵H和G;将两个对角阵矩阵F和D初始化为单位矩阵;根据H、G、C1、C2、ε1、ε2、F以及D,计算得到分类平面的参数w和b;根据w和b,计算H和D中的所有数据点到分类平面的距离,若H和D中有数据点到分类平面的距离分别大于ε1和ε2,则判断该点为野值点,将对应的F和D中的那一项值设置为一个接近零的值smallval;以更新对角矩阵F和D,计算目标值。本发明能够大大提高TWSVM算法的鲁棒性,并且在原始的数据集上也有较好的精度。
技术领域
本发明涉及算法改进和数据处理领域,特别涉及一种基于capped-l1范数的提高TWSVM算法鲁棒性的方法。
背景技术
支持向量机作为一个很好的工具,已经被广泛的应用到数据分类和回归问题上去了。其中包括生物信息、文本分类、图像处理等各个领域。近年来,Mangasarian和Wild提出了基于广义特征值的多平面近似支持向量机(Proximal SVM based 0n GeneralizedEigenvalues,GEPSVM)。该算法通过求解两个广义特征值问题来求解两个非平行超平面。GEPSVM在保证较SVM更好的计算效率的同时,也可以得到较好的分类性能。源于GEPSVM的思想,2007年,Javadeva等人提出了孪生支持向量机(Twin SVM,TSVM).TSVM寻求两个非平行的最优分类面,使得每一个分类面靠近一类样本而远离其它类样本.TSVM适合于交叉分类面数据集的分类,且求解两个相对更小的二次规划问题(Quadratic ProgrammingProblem,QPP),这使得TSVM的速度明显快于标准的支持向量机.至此以后,许多研究者在TWSVM基础上提出了不少算法。
但是,许多已存在的TWSVM模型在训练分类面时往往没有考虑到噪声数据,在现实应用中,很多数据都会有数据噪声,如果不去管这些噪声数据,会容易导致训练得到的分类平面有偏差,分类的精确度降低,算法的鲁棒性能不好。之所以噪声数据对于分类平面的决策产生影响是因为许多基于TWSVM上的模型采用的还是L2范数,L2范数通过平方操作会扩大噪声数据的影响作用。如果一个数据没有噪声,那这些算法的性能会非常好,但是,现实生活中,没有噪声的数据是不可能存在的。因此,在设计算法时,我们还要考虑到数据的噪声问题。很显然,如果数据中有许多噪声野值点,那么L2范数很不适用,基于L2范数的TWSVM模型算法也就很不适用。为了提高算法对于野值点的鲁棒性,我们提出了capped-l1范数的TWSVM,摒弃了L2的劣势,大大的提高算法的鲁棒性。
发明内容
发明目的:针对现有技术中存在的问题,本发明提供一种基于capped-l1范数的提高TWSVM算法鲁棒性的方法,能够大大提高TWSVM算法的鲁棒性,并且在原始的数据集上也有较好的精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京林业大学,未经南京林业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810622213.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多影像立体匹配方法
- 下一篇:一种基于现实地理位置的组队匹配方法