[发明专利]一种电力系统运行方式数据特征两阶段选择方法在审
申请号: | 202011318226.8 | 申请日: | 2020-11-23 |
公开(公告)号: | CN112396113A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 夏德明;胡伟;阴宏民;田增垚;刘洋;王克非;岳涵;侯凯元;屈可丁;沈毅;张博闻;马坤;蒋振宇 | 申请(专利权)人: | 国家电网公司东北分部;清华大学;国家电网有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 罗文群 |
地址: | 110000 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电力系统 运行 方式 数据 特征 阶段 选择 方法 | ||
1.一种电力系统运行方式数据特征两阶段选择方法,该方法包括以下步骤:
(1)对电力系统运行方式数据进行基于标准化互信息和交互信息增益的Filter阶段特征选择,包含以下步骤:
(1-1)从电力系统的同步矢量测量单元中获取电力系统运行方式数据,并对数据中的缺失数据进行补充,对重复数据进行删除,得到有效数据,对每一组运行数据构建出一个样本以及样本的特征,按照暂态稳定与否对样本打上0或1的标签,记做样本的类别属性C;
(1-2)构建一个已选特征子集S,初始化S为空集;构建一个备选特征集合US,初始化为空集;分别构建集合S和集合US的分类准确率指标,记做Acc(S)和Acc(US),初始化时将Acc(S)和Acc(US)分别设为0;
上述Acc(US)和Acc(S)分别表示目标最优特征子集S和备选特征集合US的分类准确率,分类准确率的计算公式如下:
式中,TP、FN、FP和TN分别表示在给定的机器学习算法中,二分类问题的样本被正确地划分为正例的样本个数、被错误地划分为负例的样本个数、被错误地划分为正例的样本个数和被正确地划分为负例的样本个数;
(1-3)根据步骤(1-1)的有效数据,构建一个电力系统运行方式数据的初始特征集合,将备选特征集合US更新为该初始特征集合;
(1-4)采用Parzen窗方法,对当前的备选特征集合US中的各个特征进行离散估计和概率密度估计,得到电力系统运行方式数据特征的概率分布,即特征fi的概率分布p(fi)、特征fj,fi的联合概率分布p(fi,fj),特征类别属性C的概率分布p(c)和特征fj在特征类别属性C下的条件概率分布p(fj,c);
(1-5)利用下式,分别计算步骤(1-4)的备选特征集合US中的所有特征f和类别属性C的标准化互信息NMI(f;C):
其中,MI(f;C)表示特征f和特征类别属性C之间的互信息,即:
H(f)表示特征f的信息熵,H(C)表示特征类别属性C的信息熵,对于单个连续变量X,信息熵的计算公式如下:
H(X)=-∫p(x)log2(p(x))
其中p(x)是变量X的概率分布;
将NMI(f;C)中取值为零的相应特征从备选特征集合US中剔除;
(1-6)计算步骤(1-4)的备选特征集合US中任意两个特征之间的NIG指标和Score指标,利用下式形成每个特征的IG-RFE评价标准结果,即对备选特征集合US的每个特征进行计算,得到备选特征集合US中所有特征的权重得分w(fi):
其中,N为备选特征集合US中的特征数量;
Score指标Score(fi,fj)的表达式如下:
(1-7)对步骤(1-6)中所有特征的权重得分w(fi)的进行降序排列,从备选特征集合US中剔除与max(1,r*N)个排序中的最小权重得分相对应的特征,其中r为后向搜索单次迭代最小剔除比例,N为备选特征集合US中特征的总个数;
(1-8)对步骤(1-7)的备选特征集合US中特征的总个数进行判断,若US为空集,则将当前的已选特征子集S输出作为最优特征子集,实现电力系统运行方式数据特征的两阶段选择;若US不为空集,则将当前的备选特征集合US作为步骤(2)的输入,进行第二阶段的筛选;
(2)以步骤(1)所得到的备选特征集合US作为改进混合核函数SVM的输入,进行第二阶段Wrapper特征选择,包含以下步骤:
(2-1)采用改进混合核函数支持向量机算法,以备选特征集合US为输入,根据10折交叉验证方法对备选特征集合US进行分类训练,输出得到当前备选特征集合US的分类准确率Acc(US);
(2-2)将已选特征子集S的分类准确率Acc(S)与步骤(2-1)计算得到的备选子集US分类准确率进行比较,若Acc(US)大于Acc(S),则将S更新为US,并将Acc(S)更新为Acc(US),返回步骤(1-4),若Acc(US)小于或等于Acc(S),则直接返回步骤(1-4)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司东北分部;清华大学;国家电网有限公司,未经国家电网公司东北分部;清华大学;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011318226.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于自然语言处理技术的配网操作票拟票方法
- 下一篇:一种吸附装置及净水系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置