[发明专利]一种基于链式方程的分布式光伏数据多重插补方法在审
申请号: | 202010690310.6 | 申请日: | 2020-07-17 |
公开(公告)号: | CN111949937A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 燕锋;项博鸿;夏玮玮;沈连丰;胡静;宋铁成 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06F17/18 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 施昊 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 链式 方程 分布式 数据 多重 方法 | ||
本发明公开了一种基于链式方程的分布式光伏数据多重插补方法,步骤:将带有缺失数据的分布式光伏数据代入插补过程,采用基于链式方程的插补方法得到多个不同的分布式光伏插补数据集,插补方法中的回归模型采用贝叶斯回归模型;对每一个分布式光伏插补数据集的统计结果进行分析,如果分析结果满足设定的要求则进行下一步;若不能满足设定的要求,则需调整回归模型或插补次数,直至分析结果满足设定的要求;最后综合所有分布式光伏插补数据集得到最终的插补结果,并将此结果作为最终的分布式光伏数据值。本发明使用链式方程的插补方法作为多重插补结构中的插补步骤,从而改善传统多重插补算法的误差。
技术领域
本发明属于分布式光伏领域,特别设计一种分布式光伏数据多重插补方法。
背景技术
随着传感器和智能分布式光伏的普及,越来越多的智能化应用比如智能故障检测系统应运而生,但是智能系统的运用必须建立在数据的采集和处理技术之上,而传感器采集数据的过程中往往会因为天气、设备等原因导致数据缺失的问题,缺失的数据必然会导致后期对数据处理产生不利的影响。因此对缺失数据的处理是对后期数据处理十分重要和必须的步骤。
对缺失数据的插补方法主要分为单变量插补和多变量插补。简单插补认为缺失值是某个常量,而多重插补认为缺失值是符合某种概率分布的变量。因此对于多重插补来说,插补结果能将变量的随机性体现出来,多变量插补往往能得到比单变量插补更精确的结果。
发明内容
为了解决上述背景技术提到的技术问题,本发明提出了一种基于链式方程的分布式光伏数据多重插补方法。
为了实现上述技术目的,本发明的技术方案为:
一种基于链式方程的分布式光伏数据多重插补方法,包括以下步骤:
(1)将带有缺失数据的分布式光伏数据代入插补过程,采用基于链式方程的插补方法得到多个不同的分布式光伏插补数据集,插补方法中的回归模型采用贝叶斯回归模型;
(2)对每一个分布式光伏插补数据集的统计结果进行分析,如果分析结果满足设定的要求则进行下一步;若不能满足设定的要求,则需调整回归模型或插补次数并返回步骤(1),直至分析结果满足设定的要求;
(3)综合所有分布式光伏插补数据集得到最终的插补结果,并将此结果作为最终的分布式光伏数据值。
进一步地,步骤(1)的具体过程如下:
(1-1)设分布式光伏传感器采集到的数据是带有缺失数据的数据集矩阵X;
(1-2)对每一个缺失值填充初始的插补值;
(1-3)对矩阵X的特征按照缺失率进行排序;
(1-4)开始迭代,先取缺失率最小的特征S,将矩阵X分成4部分:特征S中有缺失部分定义为y(s)mis,特征S中无缺失部分定义为y(s)obs,除特征S以外的所有变量中对应S特征有缺失索引的部分定义为X(s)mis,除特征S以外的所有变量中对应S特征无缺失索引的部分定义为X(s)obs;
(1-5)通过贝叶斯回归模型来拟合y(s)obs与X(s)obs,然后预测X(s)mis对应的y(s)mis;
(1-6)将预测值y(s)mis更新至矩阵X中,接着取第二小缺失率的特征S,循环所有有缺失值的特征S,并将贝叶斯回归模型的预测值填充至矩阵X中;
(1-7)将更新后的矩阵X与初始的矩阵X做比较,判断收敛函数的收敛值是否满足设定的阈值,如果不满足则返回步骤(1-4)开始下一次迭代,直至收敛值满足设定的阈值或者迭代次数达到设定的最大迭代次数。
进一步地,在步骤(1-2)中,采用原数据集的均值或者中位数作为初始的插补值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010690310.6/2.html,转载请声明来源钻瓜专利网。