[发明专利]考虑数据缺失和特征冗余的超短期负荷预测方法及系统有效
申请号: | 202011162966.7 | 申请日: | 2020-10-27 |
公开(公告)号: | CN112348168B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 任志超;叶强;马瑞光;程超;王海燕;胥威汀;汪伟;徐浩 | 申请(专利权)人: | 国网四川省电力公司经济技术研究院 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06N3/049;G06F18/214;G06F18/2413;G06Q10/04;G06Q50/06 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 张超 |
地址: | 610000 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 考虑 数据 缺失 特征 冗余 短期 负荷 预测 方法 系统 | ||
1.考虑数据缺失和特征冗余的超短期负荷预测方法,其特征在于,通过基于改进KNN的缺失数据补全算法,对存在数据缺失问题的数据集进行处理;通过基于最大信息系数MIC的包裹式特征选择方法,得到超短期负荷预测的优选特征集合,降低多变量时序数据的特征冗余度;采用S2S-GRU超短期负荷预测模型,通过序列到序列进行负荷预测;
其中,通过基于改进KNN的缺失数据补全算法,对存在数据缺失问题的数据集进行处理,具体包括以下步骤:
步骤S11:设XC为样本数据x的集合,x表示为n维空间的特征向量(a1(x),a2(x),...,an(x)),其中x*为集合XC中数据有缺失的样本;
步骤S12:计算x*与集合XC中其他所有样本x之间的弗雷歇距离,计算弗雷歇距离时只考虑x*中没有缺失数值的坐标,最终确定x*的K个最近邻;
步骤S13:根据所述K个最近邻相应坐标位置上数据的均值,插补x*的缺失坐标值;
其中,通过MIC算法对输入特征变量和负荷数据做相关性分析,结合负荷预测模型,通过后向搜索策略得到最优的特征集合,基于MIC的包裹式特征选择算法流程包括以下步骤:
步骤S21:对每一个特征变量和待预测变量计算MIC;
步骤S22:将全部特征自变量集合作为第一轮的特征候选集,从完整的特征候选集合开始,将其作为输入数据输入负荷预测模型进行训练,每轮舍弃一个相关性最低的特征变量,直至负荷预测模型满足终止阈值;
步骤S23:将步骤S22中负荷预测准确率最高的特征集合作为最终优选特征集合,准确率评价指标采用平均绝对误差MAE和平均绝对百分比误差MAPE评价函数;
其中,采用S2S-GRU模型通过序列到序列对多变量多步长用电信息集合进行有监督学习,所述用电信息集合的特征变量包括:家庭总有功能耗、家庭总无功能耗、电压强度、电流强度、厨房的有功能耗、洗衣房的有功能耗、气候控制系统的有功能耗和其他有功能耗。
2.根据权利要求1所述考虑数据缺失和特征冗余的超短期负荷预测方法,其特征在于,使用超短期负荷预测模型S2S-GRU,通过序列到序列对多变量多步长用电信息集合,进行有监督学习,包括以下步骤:
步骤S31:GRU采用门控循环神经网络结构,包括更新门和重置门,所述更新门用于控制前一时刻的状态信息保留到当前状态中的程度,所述重置门用于确定是否要结合当前状态与先前的信息;
步骤S32:所述S2S-GRU模型将原始序列通过编码和解码转换到另一个序列,更好地学习到数据之间的时序关系。
3.一种考虑数据缺失和特征冗余的超短期负荷预测系统,其特征在于,包括时序数据缺失处理单元、特征冗余处理单元和S2S-GRU模型处理单元;
所述时序数据缺失处理单元:用于通过基于改进KNN的缺失数据补全算法,对存在数据缺失问题的数据集进行处理;具体包括以下步骤:
步骤S11:设XC为样本数据x的集合,x表示为n维空间的特征向量(a1(x),a2(x),...,an(x)),其中x*为集合XC中数据有缺失的样本;
步骤S12:计算x*与集合XC中其他所有样本x之间的弗雷歇距离,计算弗雷歇距离时只考虑x*中没有缺失数值的坐标,最终确定x*的K个最近邻;
步骤S13:根据所述K个最近邻相应坐标位置上数据的均值,插补x*的缺失坐标值;
所述特征冗余处理单元:用于通过基于最大信息系数MIC的包裹式特征选择方法,得到超短期负荷预测的优选特征集合,降低多变量时序数据的特征冗余度;
其中,通过MIC算法对输入特征变量和负荷数据做相关性分析,结合负荷预测模型,通过后向搜索策略得到最优的特征集合,基于MIC的包裹式特征选择算法流程包括以下步骤:
步骤S21:对每一个特征变量和待预测变量计算MIC;
步骤S22:将全部特征自变量集合作为第一轮的特征候选集,从完整的特征候选集合开始,将其作为输入数据输入负荷预测模型进行训练,每轮舍弃一个相关性最低的特征变量,直至负荷预测模型满足终止阈值;
步骤S23:将步骤S22中负荷预测准确率最高的特征集合作为最终优选特征集合,准确率评价指标采用平均绝对误差MAE和平均绝对百分比误差MAPE评价函数;
所述S2S-GRU模型处理单元:用于采用S2S-GRU超短期负荷预测模型,通过序列到序列进行负荷预测,提高对时序信息的处理能力,从而提升超短期负荷预测的精度;
其中,采用S2S-GRU模型通过序列到序列对多变量多步长用电信息集合进行有监督学习,所述用电信息集合的特征变量包括:家庭总有功能耗、家庭总无功能耗、电压强度、电流强度、厨房的有功能耗、洗衣房的有功能耗、气候控制系统的有功能耗和其他有功能耗。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网四川省电力公司经济技术研究院,未经国网四川省电力公司经济技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011162966.7/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置