[发明专利]一种多数据模型融合的光伏发电功率预测方法和系统在审
申请号: | 202111004446.8 | 申请日: | 2021-08-30 |
公开(公告)号: | CN113919545A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 陈博;傅金波;沈怡俊;王颖;黄大建;刘涛;张文安 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/06;G06K9/62;G06N3/04;G06N3/08;G06N20/00;G06F30/27 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多数 模型 融合 发电 功率 预测 方法 系统 | ||
1.一种多数据模型融合的光伏发电功率预测方法,包括以下步骤:
步骤1:数据预处理:
步骤1-1:采用局部离群因子(LOF)算法检测、剔除异常值;通过计算每个功率点的离群因子来评估其离群的程度,首先计算每个功率点与其他功率点的欧氏距离,设k∈N+,功率点为xi,功率点xi与距离其最近的第k个点之间的距离记作dk(xi),则功率点xi到与其k距离邻域内所有功率点的可达距离为:
dr(xi,xio)=max{dk(xio),d(xi,xio)} (1)
式中,表示xi的k距离邻域内的一个功率点;表示xi与间的欧氏距离;
再计算每个功率点的局部可达密度,数学公式表述为:
最后计算功率点的离群因子,数学公式表述为:
若功率点的局部离群因子接近1,说明功率点与其邻域差异较小,视为正常点;若功率点的局部离群因子远大于1,说明功率点与其邻域差异较大,视为离群点;通过该算法检测并剔除光伏发电功率中的异常值;
步骤1-2:采用多层感知机回归算法填补缺失数据;将光伏发电功率未缺失与缺失的数据分别作为训练集与测试集,采用多层感知机回归算法在训练集中进行训练,然后用训练得到的模型对测试集进行预测,最后用预测结果填补缺失数据;多层感知机模型由输入层、隐藏层与输出层构成,从输入层到隐藏层,再到输出层的每个节点的数学公式表述为:
xij=g(WiXi-1+bi-1) (4)
式中xij第i层j第个神经元的值,Wi表示第i-1层到第i层中第j个神经元的权值向量;Xi-1表示第i-1层全部神经元值的向量;bi-1表示第i-1层的偏置项;g表示激活函数,采用ReLU函数作为激活函数;
多层感知机回归算法的损失函数,数学公式表述为:
式中,表示多层感知机回归算法的输出值;yi表示真实值,多层感知机回归算法使损失函数值收敛时停止计算;
步骤2:特征选择;通过特征选择从多个特征中选出具有代表性的特征,减少不相关的特征信息,可以降低模型的学习的难度,提高训练的效率;本发明采用距离相关系数法,判断各特征与发电功率的相关性,选取与发电功率相关性大的特征;将瞬时辐射、散射辐射、法直辐射、气温、气压、湿度和背板温度作为特征,光伏发电功率作为标签,计算各特征与标签的皮尔森相关系数与距离相关系数,其数学公式表述为:
式中,x表示某特征,y表示发电功率,v2(x,x)表示特征距离方;v2(y,y)表示发电功率距离方差;v2(x,y)表示特征与发电功率距离协方差;
通过计算得到各特征与光伏发电功率的之间的距离相关系数D(x,y)∈[0,1],其越靠近1,表示所选特征与标签与发电功率相关性越强;越靠近0,则表示所选的特征与发电功率相关性越弱;
步骤3:训练子模型;将数据分为训练集、验证集与测试集,在训练集中训练支持向量机回归(SVR)、多元线性回归(MLR)、贝叶斯岭回归(BRR)模型,并在验证集对训练得到的模型进行验证,分别选出最佳的模型作为子模型;
支持向量机回归(SVR)是一种基于风险最小化准则,用来解决回归拟合问题的机器学习方法,该算法的原理是在高维空间中进行线性回归,找到一个最优超平面,使得样本点离该超平面的总偏差最小,其数学公式表述为:
式中,ω表示权值向量,表示核函数,b表示偏置;
多元线性回归(MLR)通过建立因变量与其多个自变量的之间的数学模型,进行分析,含个自变量的多元线性回归模型数学公式表述为:
y=β0+β1x1+...+βmxm+ε (8)
式中,β0,β1,...βm表示回归系数;y表示因变量;x0,x1,...xm表示自变量;ε表示随机误差;
贝叶斯岭回归(BRR)是一种基于贝叶斯理论的回归算法,其在估计过程中引入L2正则项,因此称为贝叶斯岭回归;贝叶斯线性回归的数学公式表述为:
式中,m表示样本空间的维度;ω表示参数向量;x表示输入向量;表示x的非线性函数;
步骤4:多数据模型融合预测;用训练得到的各最佳子模型对测试集中数据进行预测,并用Q-learning算法融合各子模型的预测结果;融合过程可表示为一个马尔科夫决策过程{S,A,R},S表示状态集合,A表示动作集合,R表示奖励函数,其中状态与动作均为一组权值ω1,ω2,...,ωn,记t时刻状态ωs1,ωs2,...,ωsn为记t时刻动作ωa1,ωa2,...,ωan为奖励函数为费希尔信息,其能够反映参数估计的准确度,费希尔信息越大,表示参数估计的准确度越高,费希尔信息的计算过程如下;
首先获得模型预测值的数学表达式:
Mi=M0+ΔMi (10)
式中,Mi表示第个i模型的预测功率,M0表示真实值,ΔMi表示第i个模型预测功率的不确定度;假设其中表示第i个模型预测功率的方差;
模型的预测功率符合高斯分布,即:
因为所有模型是独立的,所以其联合概率密度为:
式中,Γ=(M1,M2,...Mn);
最后计算费希尔信息,其数学表达式:
融合过程中从状态集合获得一个状态,并从动作集合中选择一个动作,动作采取后,融合系统根据奖励函数给定奖励值,并转换到下一个状态,融合系统经过反复地学习,直到达到终止状态且Q值收敛达到最大值,其更新机制用贝尔曼方程表示:
式中,表示t时刻更新前的Q值;表示t时刻更新后的Q值;表示当前的状态;表示当前状态所采取的动作;表示下一个状态;表示状态下可采取的动作,δ表示学习率,控制训练中新旧经验的比例;γ表示折扣因子,表示未来奖励的重要程度。
2.实施权利要求1的一种多数据模型融合的光伏发电功率预测方法的系统,其特征在于:包括依次连接的数据预处理模块、特征选择模块、子模型训练模块、多数据模型融合预测模块,其中,
数据预处理模块采用局部离群因子(LOF)算法检测、剔除异常值,采用多层感知机回归算法填补缺失数据;
特征选择模块通过特征选择从多个特征中选出具有代表性的特征,减少不相关的特征信息,降低模型的学习的难度,提高训练的效率;
子模型训练模块将数据分为训练集、验证集与测试集,在训练集中训练支持向量机回归(SVR)、多元线性回归(MLR)、贝叶斯岭回归(BRR)模型,并在验证集对训练得到的模型进行验证,分别选出最佳的模型作为子模型;
多数据模型融合预测模快用训练得到的各最佳子模型对测试集中数据进行预测,并用Q-learning算法融合各子模型的预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111004446.8/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理