[发明专利]一种基于随机扰动的支持向量机奇异问题处理方法在审
申请号: | 201810253792.1 | 申请日: | 2018-03-26 |
公开(公告)号: | CN108564176A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 戴继生;王彬羽 | 申请(专利权)人: | 江苏大学 |
主分类号: | G06N99/00 | 分类号: | G06N99/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 212013 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 随机扰动 空集 方程组 支持向量机 问题处理 初始化 数据点 集合 读取 矩阵 拉格朗日乘子 归一化处理 计算复杂度 正则化参数 计数变量 特征向量 训练样本 样本数据 核函数 数据集 正则化 求解 迭代 两组 内核 输出 返回 重复 更新 | ||
1.一种基于随机扰动的支持向量机奇异问题处理方法,其特征在于,包括如下步骤:
步骤1:读取两组不同类别的数据集作为训练样本,随机重复添加较少类别的数据点,使得两类数据点的数量相同,对每一个样本数据点的特征向量进行归一化处理;
步骤2:选择核函数,计算内核矩阵K;
步骤3:初始化随机扰动系数η、拉格朗日乘子α、辅助集合ε,设置迭代次数计数变量l=0;
步骤4:判断ε是否为空集,若不是空集,直接进入下一步;若是空集,初始化ε,计算正则化参数λ和变量μ;
步骤5:构造随机扰动影响下的KKT方程组,并求解该方程组,更新λ,μ,α和ε,
步骤6:令l=l+1,返回步骤4,直到λ<0.01或集合变为空集终止,输出完整的正则化路径。
2.根据权利要求1所述的一种基于随机扰动的支持向量机奇异问题处理方法,其特征在于,所述步骤1的具体实现包括:
读取两组不同类别的数据集作为训练样本,其中第i个数据点记为(xi,yi),xi表示第i个数据点的特征向量,yi是第i个数据点对应的标签;
令数据点个数较多的类别的标签为1,数据点个数较少的类别的标签为-1。
随机重复添加标签为-1的数据点,使得标签为-1的数据点个数与标签为1的数据点相等,记总的数据点个数为N;将每个数据点的特征向量归一化处理为具有零均值、方差为1的数据。
3.根据权利要求1所述的一种基于随机扰动的支持向量机奇异问题处理方法,其特征在于,所述步骤2中:核函数为线性核函数时,其中[·]i,j表示矩阵第i行第j列的元素。
4.根据权利要求1所述的一种基于随机扰动的支持向量机奇异问题处理方法,其特征在于,所述步骤2中:核函数为高斯径向基核函数时,
5.根据权利要求1所述的一种基于随机扰动的支持向量机奇异问题处理方法,其特征在于,所述步骤3的具体实现包括:
初始化随机扰动系数的每个元素为一个高斯随机数,初始化拉格朗日乘子为全1元素,初始化辅助集合其中表示空集,设置迭代次数计数变量l=0。
6.根据权利要求5所述的一种基于随机扰动的支持向量机奇异问题处理方法,其特征在于,所述步骤4的具体实现包括:
判断ε是否为空集,若不是空集,直接进入下一步;若是空集,在集合中选取两个标签分别为1和-1的数据点和初始化ε,计算正则化参数λ和变量μ:
其中,\表示差集运算,Ki,j表示矩阵K第i行第j列的元素。
7.根据权利要求5所述的一种基于随机扰动的支持向量机奇异问题处理方法,其特征在于,所述步骤5中构造随机扰动影响下的KKT方程组:
其中,(·)T表示转置运算,[Q]i,j=yiyj[K]i,j,μ′=dμ/dλ,[α′]i=dαi/dλ,[·]i表示向量第i个元素,(·)ε表示由集合ε索引对应元素组成的子向量,(·)ε,ε表示由集合ε索引对应的行和列组成的子矩阵;
求解该方程组,得:
8.根据权利要求7所述的一种基于随机扰动的支持向量机奇异问题处理方法,其特征在于,所述步骤5中更新λ,μ,α和ε,的方法如下:
计算λ沿[μ′(α′ε)T]T向量方向的步长的最大值Δλ:
Δλ=max{Δλ1,Δλ2,Δλ3}
其中:
qi表示矩阵Q的第i列;将得到的Δλ对应数据点的索引记为i*。
更新λ,μ,α:
λ=λ+Δλ
μ=μ+Δλ·μ′
α=α+Δλ·α′
更新ε,
若Δλ=Δλ1,则ε=ε\{i*},
若Δλ=Δλ2,则ε=ε\{i*},
若Δλ=Δλ3,则ε=ε∪{i*},
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810253792.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多智能体模态逻辑可满足性判定算法
- 下一篇:基于数据分布特征的保序学习机