[发明专利]基于多因素和改进特征筛选策略的短期电力负荷预测方法有效
申请号: | 202110458740.X | 申请日: | 2021-04-27 |
公开(公告)号: | CN113193551B | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 徐先峰;赵依;刘状壮;李陇杰;卢勇;张震;代杰;段晨东;茹锋 | 申请(专利权)人: | 长安大学 |
主分类号: | H02J3/00 | 分类号: | H02J3/00;G06N3/08;G06Q10/04;G06Q50/06;G06F18/23213 |
代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 王孝明 |
地址: | 710064 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 因素 改进 特征 筛选 策略 短期 电力 负荷 预测 方法 | ||
1.一种基于多因素和改进特征筛选策略的短期电力负荷预测方法,其特征在于,该方法包括以下步骤:
步骤S1,导入原始多因素数据集和数据预处理:
步骤S11,采集待预测地区电力的历史电力负荷数据、历史温度数据、历史湿度数据和历史电价数据;
步骤S12,根据历史温度数据和历史湿度数据计算历史温湿指数数据THI,并作为一个特征属性;历史温湿指数数据的计算公式为:
THI=T+0.36Dp+41.2 公式Ⅰ;
式中:
T为干球温度的数值,干球温度的单位为℃;
Dp为露点温度的数值,露点温度的单位为℃;
步骤S13,将历史电力负荷数据、历史温度数据、历史温湿指数数据和历史电价数据整理成M×4的矩阵,该矩阵即为原始多因素数据集;
其中,M为数据采样点数;
步骤S14,对于原始多因素数据集中的异常数据和缺失数据,采用线性插值的方法进行替代和补齐;
步骤S15,对于每一属性数据的样本序列,进行无量纲归一化处理,完成数据预处理;
所述的归一化公式为:
式中:
X*为归一化后的值;
X为样本序列值;
Xmin为样本序列中的最小值;
Xmax为样本序列中的最大值;
步骤S2:构造候选特征变量集:
步骤S21,设L*为t时刻的待预测电力负荷,选取t-h时刻的h小时前历史负荷和t-d*24时刻的d天前历史负荷作为预测负荷L*的候选特征变量,由此对于历史负荷这一属性共生成30个候选特征变量;
步骤S22,使用与步骤S21同样的方法对温度、温湿指数和电价特征属性数据序列进行操作,生成对应该特征属性的30个候选特征变量;
步骤S3,基于数据集重构和RReliefF算法的小时粒度特征筛选:
步骤S31:对于待预测电力负荷序列L*=[l1,l2,l3,…l24(n-1)+i,i=1,2,…24],其中,l24(n-1)+i代表第n天第i个小时的负荷值,抽取每天第i个小时的负荷并按顺序重构造为由此重构得到对应不同小时时刻的24个新的小时级电力负荷序列;
步骤S32,使用与步骤S31同样的方法对候选特征变量集中的每个候选特征变量序列依次进行操作,则每个候选特征变量序列都重构得到对应不同小时时刻的24个新的小时级特征变量序列Fi;
步骤S33,对于第i个小时,将作为目标序列,Fi作为待选变量序列,采用RReliefF算法计算出各个待选变量序列与目标序列的相关性权重系数W(A);
步骤S34,将步骤S33中计算出的各权重系数W(A)从大到小进行排列,取对应W(A)排名前30的30个特征变量放入最优特征集Si;
步骤S35:i=1,2,…24,对于不同i的取值,重复步骤S33和步骤S34,由此得到24个不同的小时粒度最优特征集Si;
步骤S4,引入基于余弦相似度的k-means聚类标签;
步骤S41,随机选择K个初始聚类中心C1,C2,…CK,对应K个类簇V1,V2,…VK;
步骤S42,分别计算每个日负荷样本DLi=[dl1,dl2,…dl24]到第k个聚类中心Ck=[c1,c2,…c24]的余弦相似度Scos(DLi,Ck),其计算公式为:
步骤S43,根据样本与聚类中心相似度最高的原则对其进行分类,若步骤S42中求出的K个余弦相似度中的最大值对应的聚类中心为Ck,则将日负荷样本DLi划分至类簇Vk,按照此规则将所有电力负荷样本划分至类簇V1,V2,…VK中;
步骤S44,计算每个聚类中所有样本的均值并将其更新为新的聚类中心Ck;
其中,|Vk|表示第k个类簇中样本对象的个数;
步骤S45,重复步骤S42至步骤S44,直到聚类中心不再改变或达到设定的迭代次数上限;
步骤S46,对聚类结果计算轮廓系数,轮廓系数s(i)的计算公式为:
式中:
a(i)为样本DLi到同簇其他样本DLj的平均余弦相似度;
b(i)为样本DLi到其他簇中所有样本DLj的平均余弦相似度;
步骤S47,给定K的取值范围,给定聚类算法迭代次数,对应不同K的取值分别重复执行上述步骤S41至步骤S46;
S48:取对应轮廓系数最大的K值作为最优的聚类个数,并将K=最优聚类个数下的聚类结果标签V=[v1,v2,…vK]作为一维特征变量;
步骤S5,确定最终的输入变量集:
步骤S51,根据待预测电力负荷序列每一点的对应采样时间,生成表征小时信息的时间变量H,H的取值范围为1~24的整数,对于第i个小时的负荷,其时间变量H=i;
步骤S52,对于预测第n天第i个小时的负荷值L*,最终输入预测模型的变量集S*包括:由步骤S3得到的对应第i个小时的最优特征集Si,由步骤S4得到的对应第n天的聚类标签V,以及由步骤S51生成的时间变量H;最终输入预测模型的变量集S*共计32维;
步骤S6:模型训练与预测;
步骤S61,按照上述步骤S1至步骤S5准备好的待预测电力负荷序列L*和最终输入变量集S*,划分训练集和测试集;
步骤S62,将训练集输入预测模型进行训练并调整超参数;
步骤S63,预测模型训练完毕后,输入测试集完成提前1小时的电力负荷预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长安大学,未经长安大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110458740.X/1.html,转载请声明来源钻瓜专利网。