[发明专利]基于深层特征组合的电网新能源消纳能力预测方法在审
申请号: | 201910724451.2 | 申请日: | 2019-08-01 |
公开(公告)号: | CN111738477A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 李寒;刘晨;杨中国;黄越辉;李驰;王跃峰;雷震;郝雨辰;金鑫 | 申请(专利权)人: | 北方工业大学;中国电力科学研究院有限公司;国网江苏省电力有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100144 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深层 特征 组合 电网 新能源 能力 预测 方法 | ||
1.基于深层特征组合的电网新能源消纳能力预测方法,其特征在于,包括两部分内容,分别为特征选择与特征组合;
第一阶段,特征选择;
首先从数据中提取特征,作为模型的输入,然后经过方差特征选择去掉方差小的特征,接着使用递归式特征消除进行特征选择;
第二阶段,特征组合;
通过XGBoost与LightGBM方法来组合特征,建立了一个混合模型,将由XGBoost和LightGBM算法产生的预测结合起来,进行集成预测,XGBoost与LightGBM模型中的参数是通过网格搜索技术进行优化调整的。
2.根据权利要求1所述的基于深层特征组合的电网新能源消纳能力预测方法,其特征在于,所述的特征选择分别包含低方差特征过滤和递归式特性消除;
低方差特征过滤:计算样本中每一个特征值所对应的方差,如果低于事先设定的阈值,则进行过滤,通常情况下会剔除所有零方差特征,方差为0表示样本的特征取值没发生变化;
递归式特征消除:
递归式特征消除使用一个机器学习模型来进行多轮训练,每轮训练结束后,消除若干权值系数对应的特征,再基于新的特征集进行下一轮训练,通常的递归式特征消除方法通过学习器返回的系数或者特征重要度来获得每个特征的重要程度,然后,从当前的特征集合中移除最不重要的特征,在特征集合上不断的重复递归这个步骤,直到最终达到所需要的特征数量为止;
所述的特征组合,在上述特征集合上训练XGBoost模型和LightGBM模型,通过XGBoost树模型和LightGBM树模型构造新的特征组合,并且在其中加入PCA降维,最后建立一个混合模型,将XGBoost和LightGBM算法产生的预测结合起来,进行集成预测。
3.根据权利要求2所述的基于深层特征组合的电网新能源消纳能力预测方法,其特征在于,所述的XGBoost在目标函数里加入了正则项,用于控制模型的复杂度,正则项里包含了树的叶子节点个数和每棵树叶子节点上面输出分数的模平方,XGBoost则对目标函数进行了二阶泰勒展开;
所述的XGBoost的目标函数为:
对给定的数据集D有n个样本和m个特征,D={(xi,yi)}(|D|=n,集成树模型采用的是K个额外的加法函数去预测输出;
其中是回归树空间,q代表树结构,将每个样本映射到叶子节点,T是树的个数,每一个fk对应了一个单独的树结构,以及叶子权重w。为了学习这一系列的函数,我们需要最优化下面的目标函数:
其中,这里的l是一个误差的凸函数用来计算预测值和原始值的偏差,Ω是用来惩罚模型复杂度的正则项,正则项的作用是避免模型的过拟合的,当正则项的参数设为0的时候,目标函数就变成了传统的梯度树模型,考虑到模型以递增原则进行训练,目标函数可以改写为:
将使用二阶泰勒展开式将目标函数更一步改写为:
其中,以及是一阶和二阶梯度量,将常量项移除后,目标函数可以简写为:
。
4.根据权利要求2所述的基于深层特征组合的电网新能源消纳能力预测方法,其特征在于,所述的LightGBM是在当前所有叶子节点中选择分裂收益最大的节点进行分裂,如此递归进行。
5.根据权利要求1所述的基于深层特征组合的电网新能源消纳能力预测方法,其特征在于,所述的特征选择包括PCA降维;
假设原始数据特征为n维向量,经过特征选择的特征向量为m维,将m维的向量作为XGBoost的输入,同时也作为LightGBM的输入,XGBoost和LightGBM分别输出预测的叶子结点的位置并分别进行one-hot编码;
应用PCA主成分分析来对高维特征进行降维,经过PCA处理的数据能够有效对抗异常数据,在PCA中,主成分的贡献率(CR)和累积贡献(CC)分别由以下方法计算:
其中,λi是第i个主成分的特征值,p为输入特征向量的维度,CRi为第i个主成分的贡献率,CCi为从第1个主成分到第i个主成分的贡献率之和,也就是累积贡献率,这些数据是通过原始数据集构造特征矩阵,通过特征值分解得到每个特征值及对应的特征向量,也就是λi和它对应的特征向量,通过计算累积贡献率可以选择维度,当累积贡献率达到设定的阈值时,即选取该累计贡献率对应的i作为PCA降维后的维度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方工业大学;中国电力科学研究院有限公司;国网江苏省电力有限公司,未经北方工业大学;中国电力科学研究院有限公司;国网江苏省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910724451.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于车辆的折叠及下俯式座椅
- 下一篇:用于车辆的防盗装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理