[发明专利]一种基于DPSO-WKELM-IFSVM的非线性数据分类方法在审
申请号: | 201910891353.8 | 申请日: | 2019-09-21 |
公开(公告)号: | CN110598071A | 公开(公告)日: | 2019-12-20 |
发明(设计)人: | 胡燕祝;王松 | 申请(专利权)人: | 胡燕祝 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 非线性数据 分类 分类准确率 非线性映射能力 函数逼近能力 数据处理领域 不等式约束 极限学习机 计算复杂度 隶属度函数 等式约束 分类提供 分类效果 构造决策 收敛位置 网络输出 样本数据 核变换 核函数 识别率 学习机 构建 样本 替代 更新 改进 | ||
本发明涉及基于DPSO‑WKELM‑IFSVM的非线性数据分类方法,是一种对非线性数据进行分类的方法,属于数据处理领域,其特征在于采用如下步骤:(1)更新样本数据收敛位置及速度;(2)求得网络输出权值;(3)构造核函数;(4)求学习机核变换函数;(5)样本隶属度函数构建;(6)构造决策函数。本发明克服非线性映射能力较差,识别率低问题。改进的极限学习机在函数逼近能力效果好,更好的处理非线性数据,有效提高分类准确率,完成非线性数据分类。这说明本发明对非线性数据分类,达到较好分类效果。采用等式约束替代不等式约束,降低计算复杂度,加快运行速度。为非线性数据进行分类提供了一种拥有较高分类准确率的方法。
技术领域
本发明涉及数据处理与机器学习领域,主要是一种对非线性数据进行分类的方法。
背景技术
数据分类是多个学科的交叉学科,被广泛用于市场风险预测,风险管控等方面。随着数据量和形式的急剧增长,复杂数据分类的研究充满了挑战,尤其是非线性数据分类中,从建模到分类算法方面均未达到令人满意的效果。一方面,随着上述新兴技术、产业的发展与推广,大量实时在线数据的快速收集得以实现,以数据分类为代表的数据挖掘技术将在越来越多的领域中发挥更大的作用。另一方面,从数据维度、数据类型及数据体量等不同层面来看,数据对象正变的越来越多样化、复杂化,这极大的增加了精准化和精细化挖掘的难度,同时在知识获取的准确性、合理性、可靠性及实用性等多个方面对数据分类的要求也越来越严格。
数据分类方法主要用于离散型数据样本的样本类别辨识与分析,随着关系数据库管理系统、数据仓库、数据抽取转换与装载化及联机分析处理等技术在商业应用中的成熟,C4.5、K-means算法、ISVM等许多经典机器学习算法得在数据分类等不同领域推广和发展。现有的IFSVM等方式,在引入参数时未做优化,分类效果不够明显。经典的PSO方式虽然使用了样本到类中心的间距,但是在样本周围密度及信息量的隶属度函数是为进行很好的优化,不能起到较好的分类效果。另外,ELM在训练过程中随机产生的输入层权值和隐层节点偏置对模型的稳定性及分类精度产生的较大影响。随着数据量的急剧增加,在数据分类精度和速度方面,都提出了相对较高的要求。因此,要实时准确数据分类,必须要建立一种高效、准确的数据分类方法,有效的减少处理时间,提高分类准确率,为后续数据处理步骤提供更加精确的数据类别。
发明内容
针对上述现有技术中存在的问题,本发明要解决的技术问题是提供一种基于DPSO-WKELM-IFSVM的非线性数据分类方法,其具体流程如图1所示。
技术方案实施步骤如下:
(1)更新样本数据收敛位置及速度
式中,表示样本的位置属性,表示速度向量,k表示迭代次数,d表示搜索空间维度,i表示粒子实例,cs1,cs2表示学习因子,为[0,1]内的随机数,描述样本个体和周围紧密度大小,Ttarget取可行域内的值。
(2)训练网络输出Ti:
式中,g(x)表示模型激活函数,L表示隐藏层节点数,wi=[w1,w1,...wN]为神经元权值向量,βi=[β1,β2...βm]为隐藏层和输出层链接权值,bi=[b1,b2...bm]T为隐藏节点偏置。
(3)构造核函数ΩELM:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于胡燕祝,未经胡燕祝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910891353.8/2.html,转载请声明来源钻瓜专利网。