[发明专利]一种基于CatBoost和LSTM模型融合的短期负荷预测方法有效
申请号: | 202110086845.7 | 申请日: | 2021-01-22 |
公开(公告)号: | CN112785056B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 陈忠华;俞容江;高振宇;王才倩;陈嘉敏;石国超;董悦 | 申请(专利权)人: | 杭州市电力设计院有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/06;G06N3/0442;G06N3/08;G06N20/20;G06F18/2431 |
代理公司: | 杭州万合知识产权代理事务所(特殊普通合伙) 33294 | 代理人: | 丁海华;万珠明 |
地址: | 310000 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 catboost lstm 模型 融合 短期 负荷 预测 方法 | ||
1.一种基于CatBoost和LSTM模型融合的短期负荷预测方法,其特征在于:包括以下步骤:
S1、获取样本数据,提取样本数据的特征向量并进行预处理;
S2、利用预处理后的样本数据,使用K折交叉验证分别训练得到多个CatBoost模型和LSTM模型;
S3、利用Stacking策略,用RidgeRegression模型来融合CatBoost模型和LSTM模型的预测结果,用以构建混合模型,再使用混合模型来进行短期负荷的预测;
所述样本数据表示为:
{(x1,y1),(x2,y2),...,(xn,yn)};
其中:xi是第i个样本的特征向量,m是特征维度;yi是第i个样本的负荷数据;
所述特征向量包括时间特征、天气特征、节假日特征、历史负荷特征;
所述时间特征包括年份、季度、月份、日、星期、一周的第几天和是否是周末;
所述天气特征包括日最高气温、日最低气温、日平均气温、日最大气温差、日最高湿度、日最低湿度、日平均湿度和日最大湿度差;
所述节假日特征包括该日是否为节假日和是否为调休日;
所述历史负荷特征包括使用前一周的历史负荷;
将CatBoost模型和LSTM模型作为Stacking第一层的基学习器,用一个RidgeRegression模型作为Stacking第二层的结合模型,将第一层的基学习器的输出作为第二层的结合模型的输入,构建一个混合模型;
将CatBoost模型和LSTM模型对验证集的预测结果拼接起来,作为第二层的训练集特征;将CatBoost模型和LSTM模型对测试集的预测结果作为第二层的测试集特征,得到最终的短期负荷预测。
2.根据权利要求1所述的基于CatBoost和LSTM模型融合的短期负荷预测方法,其特征在于:所述预处理包括缺失值的处理、归一化处理和独热编码;
所述缺失值处理是采用线性插值对样本数据中的缺失值进行补全,所述线性插值 表示如下:
其中,为缺失值,表示第n个样本的第k维特征向量;表示第n-1个样本的第k维特征向量;表示第n+1个样本的第k为特征向量;
所述归一化处理用于处理天气特征和历史负荷特征,归一化公式如下:
其中:是归一化处理后的数据;x是原始数据;xmax是对应特征在样本数据中的最大值;xmin是对应特征在样本数据中的最小值;
所述独热编码用于处理时间特征和节假日特征;通过对时间特征和节假日特征进行独热编码转换成二进制编码,用于LSTM模型的输入。
3.根据权利要求1所述的基于CatBoost和LSTM模型融合的短期负荷预测方法,其特征在于:所述S2步骤具体如下:将经过预处理的样本数据作为训练集,在训练CatBoost模型和LSTM模型时,采用K折交叉验证法,取K为10,将训练集分为10份,通过10轮训练得到10个CatBoost模型和10个LSTM模型;
在每轮训练的时,依次用每份训练集中的其中9份作为测试集,剩余1份作为验证集,经过10次训练后,用每次训练得到的CatBoost模型和LSTM模型分别对验证集和测试集进行预测,将CatBoost模型和LSTM模型的各自的10个验证集预测结果对应拼接起来,得到原训练集的预测结果;将CatBoost模型和LSTM模型的各自的10个测试集的预测结果取平均值,得到测试集的预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州市电力设计院有限公司,未经杭州市电力设计院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110086845.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种加温链条机构
- 下一篇:一种成员推断模型的训练方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理