[发明专利]基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法有效
申请号: | 201910598184.9 | 申请日: | 2019-07-04 |
公开(公告)号: | CN110413601B | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 潘蕾;王钱超;徐宏灿;尹琦;沈炯;李益国 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06K9/62;G06Q50/06 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 徐红梅 |
地址: | 211102 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 朴素 贝叶斯 预报 误差 发电机 数据 筛选 | ||
本发明公开了一种基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法,包括分析所选辨识对象特性,得到相应的辨识参数;针对对象经验辨识结果和数据本身的分布特性,选择适量的可辨识和难以辨识的数据组成训练集;利用训练集对高斯朴素贝叶斯分类器进行训练,得到各个参数的先验概率;利用训练后的分类器对测试集进行粗分,得到多个可用数据段;利用预报误差法的模型拟合度对可用数据段进行细分,得到最优可辨识数据段,或者设置拟合度阈值,得到多个辨识较好数据段。本发明节省了大量的数据处理时间,避免了多次重复劳动,同时提高了筛选数据的精度。
技术领域
本发明属于大数据技术领域,涉及一种基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法-GaussianNB-PEM数据筛选法。
背景技术
大数据技术正在推动发电企业的科技创新。对海量实时数据进行有效性甄别和选择是大数据方法应用成功的重要环节。由于工业现场数据中包含所有影响因素,如设备大范围变工况、随机干扰、多扰动等,需要通过数据检验方法选择出符合特定应用需求的数据段。
贝叶斯算法是一种基于统计的分类算法,将分类问题转化为概率问题看,所有的概率都是从数据中计算或者估计得到。朴素贝叶斯分类算法是一种可以和决策树、神经网络分类算法相媲美的算法,不仅能够运用到大型数据库中,而且方法简单、且分类准确率高、速度快。其中引入了“属性条件独立性假设”条件,形成两个基础假设:1、对于每一个假设特征都互相独立;2、任何属性与输出结果都是有关系的,并且影响程度相等。高斯朴素贝叶斯,在处理连续数据时,假设每个分类相关的特征是连续的且按照高斯分布。
预报误差法是指利用k时刻之前的输入和输出信号计算(k+1)直到未来时刻的输出的方法。给定观测量z(k)之后,调整参数θ,使预报的均方根误差达到最小参数估计。
若能将高斯朴素贝叶斯分类器和预报误差结合,则可在训练集不完全准确的情况下,在大范围实际数据中找出能较为准确辨识的数据段,避免大量重复劳动和节约数据筛选时间,而目前尚没有相关文献和专利。
发明内容
发明目的:针对火电厂实时运行数据中不确定因素多、模型辨识数据样本难以正确筛选的问题,本发明尝试利用贝叶斯算法进行样本的统计学习,以筛选获得有效的闭环辨识数据样本。
技术方案:为实现上述发明目的,本发明采用以下技术方案:
基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法,包括以下步骤:
(1)分析发电机组辨识对象特性,得到相应的辨识参数作为筛选法的输入参数;
(2)针对发电机组辨识对象经验辨识结果和辨识参数数据本身的分布特性,选择适量的可辨识和难以辨识的数据组成训练集;利用训练集对高斯朴素贝叶斯分类器进行训练,得到各个参数的先验概率;利用训练后的分类器对测试集进行粗分,得到多个可用数据段;
(3)利用预报误差法的模型拟合度对可用数据段进行细分,得到最优可辨识数据段,或者设置拟合度阈值,得到多个辨识较好数据段。
进一步的,步骤(1)具体为:辨识对象为发电机组内部环节,选择与辨识对象相关的主要参数,即辨识参数,作为GaussianNB-PEM数据筛选法的输入参数,包括发电机组的被控参数集合y、控制参数集合u和扰动参数集合r;每一个辨识参数均作为辨识对象的一个属性,共有d个,d为正整数;输入参数的数据分为若干个类别,某个类别用序号表示为第c个类别,c为正整数,建立在{y,u,r}属性集上,每个属性上的取值记为{xi,i∈1~d}。
进一步的,步骤(2)具体为:根据发电机组辨识参数数据特性和辨识参数数据所需长度选择合适的可辨识参数数据和难以辨识参数数据组成训练集,将可辨识参数中的每一组数据的标签记为1,难以辨识参数中的每一组数据的标签记为2,共分两类,c=1或c=2,以此训练集对分类器进行训练;发电机组辨识参数的非训练集数据均属于测试集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910598184.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据管理方法及装置
- 下一篇:一种分层清洗式大数据清洗方法