[发明专利]一种基于全局代表点选择的稀疏最小二乘支持向量机在审
申请号: | 202010289427.3 | 申请日: | 2020-04-14 |
公开(公告)号: | CN111428810A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 马跃峰;王茂励;梁循;李光顺 | 申请(专利权)人: | 曲阜师范大学;马跃峰 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 合肥左心专利代理事务所(普通合伙) 34152 | 代理人: | 周翠娟 |
地址: | 272000 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 全局 代表 选择 稀疏 最小 支持 向量 | ||
本发明公开了一种基于全局代表点选择的稀疏最小二乘支持向量机,其方法包括以下步骤:A、利用点密度和点分散度建立全局选择点指标‑全局代表性;B、利用全局选择点指标构建稀疏LS‑SVM的保留支持向量集,并将全局选择点指标分为两部分。本发明先利用点密度和点分散度建立全局选择点指标‑全局代表性,再利用全局选择点指标构建稀疏LS‑SVM的保留支持向量集,再将训练样本用于支持向量回归机的训练,最后利用训练样本集,对优化参数的LS‑SVM进行训练,得到最优化的LS‑SVM数学模型,采用这种非迭代的修剪方法获得保留支持向量集,有效降低了数据计算的复杂度和内存复杂度,适用于大规模数据处理,并有利于数据的分类与回归。
技术领域
本发明涉及最小二乘支持向量机应用技术领域,具体为一种基于全局代表点选择的稀疏最小二乘支持向量机。
背景技术
支持向量机是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面,支持向量机使用铰链损失函数计算经验风险并在求解系统中加入了正则化项以优化结构风险,是一个具有稀疏性和稳健性的分类器,支持向量机可以通过核方法进行非线性分类,是常见的核学习方法之一,随着机器学习的迅速发展,数据的分类和回归尤为重要,最小二乘支持向量机(LS-SVM)提供与SVM相当的性能,但LS-SVM的约束在于缺乏稀疏性,考虑计算和内存成本,难以处理大规模数据,为了获得稀疏的LS-SVM,以往的修剪方法大都基于迭代策略,计算和内存成本仍较大,为此,我们提出一种基于全局代表点选择的稀疏最小二乘支持向量机。
发明内容
本发明的目的在于提供一种基于全局代表点选择的稀疏最小二乘支持向量机,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于全局代表点选择的稀疏最小二乘支持向量机,其方法包括以下步骤:
A、利用点密度和点分散度建立全局选择点指标-全局代表性;
B、利用全局选择点指标构建稀疏LS-SVM的保留支持向量集,并将全局选择点指标分为两部分,一部分作为LS-SVM训练样本,一部分作为测试样本(测试样本用于测试模型的精度),并通过PSO算法对LS-SVM参数进行优化,即粒子群算法对LS-SVM参数进行优化,然后将训练样本用于支持向量回归机的训练,得到最小二乘支持向量机数学模型;
C、利用训练样本集,对优化参数的LS-SVM进行训练,得到最优化的LS-SVM数学模型。
优选的,所述步骤A中,建立全局选择点指标-全局代表性包括以下步骤:
①、输入数据集、核函数和阈值;
②、初始化点密度、点分散度、点的全局代表性;
③、计算在特征空间中,两点间的距离;
④、计算点密度;
⑤、计算点分散度;
⑥、计算点的全局代表性;
⑦、输出点的全局代表性。
优选的,所述步骤A中的点密度是指该点与其他点距离小于阈值的点的个数,即以点为中心,一定范围内点的个数,点分散度是指该点与其他点密度大于它的点的距离中的最小值,且点密度最大的点的分散度定义为与其他点的距离中的最大值,点的全局代表性是取该点的点密度和点分散度归一化后的最小值,同时,为避免保留支持向量集中仅包含一个类中的点的情况,在训练时,从每个类中按比例挑选一定数量的全局代表点。
优选的,所述步骤B中,构建稀疏LS-SVM的保留支持向量集包括以下步骤:
①、输入数据集、标签集、核函数、正类和负类的阈值和保留支持向量的数目;
②、计算正、负类的保留向量数目;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曲阜师范大学;马跃峰,未经曲阜师范大学;马跃峰许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010289427.3/2.html,转载请声明来源钻瓜专利网。