[发明专利]基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法及系统在审
申请号: | 201910236266.9 | 申请日: | 2019-03-27 |
公开(公告)号: | CN110223193A | 公开(公告)日: | 2019-09-10 |
发明(设计)人: | 娄建楼;时丹丹;孟勃;曲朝阳;王蕾;郭晓利 | 申请(专利权)人: | 东北电力大学 |
主分类号: | G06Q50/06 | 分类号: | G06Q50/06;G06K9/62 |
代理公司: | 西安合创非凡知识产权代理事务所(普通合伙) 61248 | 代理人: | 杨蕾 |
地址: | 132012 *** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电网运行状态 特征变量 训练集 模糊聚类 亚健康 模糊聚类算法 健康状态 输入变量 数据量纲 电网 归一化 健康 聚类 标签 输出 分类 | ||
1.基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法,其特征在于:包括如下步骤:
Step 1:选择用于电网运行状态判别的特征变量;
Step 2:划分电网运行状态类型
使用模糊聚类算法,将电网运行的健康状态按照健康程度分为四种类型,分别为健康、亚健康、一般病态和严重病态。在聚类前,为了消除数据量纲的影响,需要采用归一化方法对电网的特征变量数据进行处理。
Step 3:构造训练集
将步骤1中得到的特征变量,作为训练集的输入变量,将步骤2中得到的已经分类电网运行状态所对应的数据作为训练集,训练集输出结果是对应的电网运行状态,健康、亚健康、一般病态和严重病态这四种电网运行状态所对应的标签分别设定为1、2、3和4
Step 4:训练 RS-KNN模型
首先使用随机子空间方法在原训练样本的特征空间中随机抽样,构造新的训练集。然后,利用新的样本训练集来训练基分类器KNN。最后,通过多数投票规则融合多个KNN基分类器,输出的结果是电网运行状态的分类结果。
2.如权利要求1所述的基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法,其特征在于:所述步骤Step1具体包括如下步骤:
S11:使用使数据集中的电网运行正常样本和故障样本相对平衡;
S12:随机森林-递归特征消除用于选取重要变量;
S12.1训练集是利用初始变量集构建的,包含多个训练样本,其输入为:
训练集的输出为:
其中,为训练样本总数,是指第个变量,是指第个输入样本,则是代表第个输入样本的第个变量。变量的内容如图2-1。是指电网运行状态判别的标签,其中,1用于表示电网正常状态,而–1表示电网故障状态。
S12.2利用随机森林得到10个初始变量集中各变量的重要度,并且记录当变量个数为初始变量集时的分类正确率。
S12.3每次删除一个最不重要的变量,使用删除变量后的变量集重新构造一个新的训练集,并重新测试训练集的分类正确率。
S12.4重复12.3直到只剩下一个重要性最大的变量,所有的变量都被搜索结束。
在步骤S12后,初始变量集即10个变量的重要度排序被得到,也可以得到不同变量所对应训练集的分类正确率。获得最高分类正确率时,所用的输入变量就是重要变量。
3.如权利要求2所述的基于模糊聚类和RS-KNN模型用于电网运行状态的判别方法,其特征在于:所述步骤S11具体包括如下步骤:
Step1:在故障样本集中,为故障样本集中的每个样本找到距离该样本最近的个样本,度量标准采用欧式距离。
Step2:随机在每个电网故障样本的个最近邻样本中抽取样本数为,为采样倍率,由正常样本数与故障样本数的比值确定。
Step3:基于式(1),构建新的故障样本,是与之间的随机线性插值,其中是随机选择的最近邻样本,是故障样本。
(1)
上式中代表一个随机数,其取值范围在[0,1]区间。
Step4:把生成的电网故障样本与原始数据集组合,获得两个类别数量比较平衡的数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北电力大学,未经东北电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910236266.9/1.html,转载请声明来源钻瓜专利网。