[发明专利]基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法有效
申请号: | 201910598184.9 | 申请日: | 2019-07-04 |
公开(公告)号: | CN110413601B | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 潘蕾;王钱超;徐宏灿;尹琦;沈炯;李益国 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06K9/62;G06Q50/06 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 徐红梅 |
地址: | 211102 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 朴素 贝叶斯 预报 误差 发电机 数据 筛选 | ||
1.基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法,其特征在于,包括以下步骤:
(1)分析发电机组辨识对象特性,得到相应的辨识参数作为筛选法的输入参数;
(2)针对发电机组辨识对象经验辨识结果和辨识参数数据本身的分布特性,根据需求选择可辨识和难以辨识的数据组成训练集;利用训练集对高斯朴素贝叶斯分类器进行训练,得到各个参数的先验概率;利用训练后的分类器对测试集进行粗分,得到多个可用数据段;
(3)利用预报误差法的模型拟合度对可用数据段进行细分,得到最优可辨识数据段,或者设置拟合度阈值,得到多个辨识较好数据段。
2.根据权利要求1所述的基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法,其特征在于,步骤(1)具体为:辨识对象为发电机组内部环节,选择与辨识对象相关的主要参数,即辨识参数,作为GaussianNB-PEM数据筛选法的输入参数,包括发电机组的被控参数集合y、控制参数集合u和扰动参数集合r;每一个辨识参数均作为辨识对象的一个属性,共有d个,d为正整数;输入参数的数据分为若干个类别,某个类别用序号表示为第c个类别,c为正整数,建立在{y,u,r}属性集上,每个属性上的取值记为{xi,i∈1~d}。
3.根据权利要求1所述的基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法,其特征在于,步骤(2)具体为:根据发电机组辨识参数数据特性和辨识参数数据所需长度选择可辨识参数数据和难以辨识参数数据组成训练集,将可辨识参数中的每一组数据的标签记为1,难以辨识参数中的每一组数据的标签记为2,共分两类,c=1或c=2,以此训练集对分类器进行训练;发电机组辨识参数的非训练集数据均属于测试集;
训练和筛选步骤如下:
(21)利用训练集计算各辨识参数的先验概率,对分类器进行训练:
其中,P(c|x)为第c个类别相对于训练样本x的类条件概率;P(x)是用于归一化的因子;P(x|c)是训练样本x相对于第c个类别的类条件概率;P(c)是先验概率;P(xi|c)为x在第i个属性上的取值相对于第c个类别的类条件概率;xi为x在第i个属性上的取值;d为属性数目;对于已知训练样本x,P(x)与类标记无关,基于训练集提供的信息来计算得到P(c)和P(x|c);
(22)利用高斯朴素贝叶斯分类器对测试样本进行初步分类:
高斯朴素贝叶斯分类器,在处理连续数据时,假设每个分类相关的特征是连续的且按照高斯分布,即可得到P(x|c):
其中,μc对应类别c下xi的均值;σ2c是方差;
(23)对测试集进行分类
将测试集代入训练好的分类器中,用已知类标记的所有类别计算概率Pnb,并选择输出概率最大的结果所代表的类别作为最终输出:
其中,Pnb(x)是测试集数据分别在c=1和c=2两类标记下的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910598184.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据管理方法及装置
- 下一篇:一种分层清洗式大数据清洗方法