[发明专利]一种基于用电特征和Mean Shift算法的用户类型分类方法在审
申请号: | 202210134165.2 | 申请日: | 2022-02-14 |
公开(公告)号: | CN114692672A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 沈百强;麻吕斌;李磊;芦鹏飞;肖涛;韩蕾;林英鹤;董伟 | 申请(专利权)人: | 国网浙江省电力有限公司;国网浙江省电力有限公司营销服务中心;浙江华云信息科技有限公司;国家电网有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;H02J3/00 |
代理公司: | 浙江翔隆专利事务所(普通合伙) 33206 | 代理人: | 王晓燕 |
地址: | 310007 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用电 特征 mean shift 算法 用户 类型 分类 方法 | ||
1.一种基于用电特征和Mean Shift算法的用户类型分类方法,其特征在于包括以下步骤:
1)获取各用户用电数据;
2)数据预处理,包括对异常数据进行筛选、填充、对齐处理;
3)获取预处理后的负荷数据和电量数据;
4)在负荷数据和电量数据中抽取曲线技术指标特征得到对应的负荷特征和电量特征,负荷特征包括日负荷24点特征、负荷的日/周/月/季对应的K线特征、负荷峰谷特征,负荷峰谷特征包括日峰/日谷负荷、日/周/月/季均线特征;电量特征包括电量的日/周/月/季特征;
5)根据负荷特征和电量特征计算对应的负荷变化特征量和电量变化特征量;
6)将负荷特征、电量特征、负荷变化特征量、电量变化特征量拼接组装成向量;
7)对向量进行降维和特征筛选;使用PCA算法对特征进行降维和特征筛选;
8)对降维后的向量使用Mean Shift算法进行用户分类,得到各用户的类别标签;
9)输出类别标签,并根据类别标签进行用电趋势分析预测,进行对应的电能储备。
2.根据权利要求1所述的一种基于用电特征和Mean Shift算法的用户类型分类方法,其特征在于:在步骤2)中,数据预处理时,对数据补全修正,并进行归一化处理;
对于缺失的数据,采用相邻点平均的方法,进行填充;当对于每天24个点的电荷数据,缺失某个时间点的数据时,采用相邻两点t1,t2的电荷信息,进行填充,具体公式为Pt=P1+(P2-P1)(t-t1)/(t2-t1);Pt是需要填充的数据,P1,P2为与t相邻两个时间点t1,t2对应的数据;
对于异常数据,采用中心点距离检测的方法来计算异常点;对于电荷数据,统计每家企业的电荷均值μ,方差σ,对于μ±5σ的数据点认为是异常数据;去除异常点后留下的空缺数据点采用相邻点平均法替换;
对于不同物理意义的数据,将每一维向量都变换到[-1,1]统一的范围内。
3.根据权利要求1所述的一种基于用电特征和Mean Shift算法的用户类型分类方法,其特征在于:在步骤4)中,负荷特征中:
a)日负荷24点特征为:
一天24小时,每个小时的用电负荷为Pn,n=[1,2,...,24],一天用电负荷有24个点;日负荷24点特征为24维;
b)负荷的日/周/月/季对应的K线特征为:
K线特征包括某时间段的最大值,最小值,平均值;
负荷日K线:为单日用电的K线特征,基于日负荷24点特征来计算,即[Pmax_day,Pmin_day,Pavg_day]=[max(P1,…,P24),min(P1,…,P24),sum(P1,…,P24)/24];其中,max()为求取最大值,min()为求取最小值,sum()为求和;
负荷周K线:为一个周用电负荷的K线特征,基于一周七天的日负荷24点特征来计算,即[Pmax_week,Pmin_week,Pavg_week]=[max(P1_1,…,P24_7),min(P1_1,…,P24_7),sum(P1_1,…,P24_7)/24/7],这里Pn_m为一周中第m天的第n个数据点,m=[1,…,7],n=[1,2,...,24];
负荷月K线:为一个月用电负荷的K线特征,基于一月31天的日负荷24点特征来计算,即[Pmax_month,Pmin_month,Pavg_month]=[max(P1_1_,…,P24_31_),min(P1_1_,…,P24_31_),sum(P1_1_,…,P24_31_)/24/31];Pn_k_为一个月中第k天的第n个数据点,k=[1,…,31],n=[1,2,...,24];对于不满31天的月份,按31天补齐,补齐数据用后续数据填充;
负荷季K线:为一个季度一个月用电负荷的K线特征,基于一个季度一月31天的日负荷24点特征来计算,即[Pmax_season,Pmin_season,Pavg_season]=[max(P1_1_1,…,P24_31_3),min(P1_1_1,…,P24_31_3),sum(P1_1_1,…,P24_31_3)/24/31];Pn_k_s为一季度中第s个月第m天第n个数据点,s=[1,2,3],k=[1,…,31],n=[1,2,...,24];
负荷的日/周/月/季对应的K线特征为12维;Pmax_day为日负荷最大值,Pmin_day为日负荷最小值,Pavg_day为日负荷平均值,Pmax_week为周负荷最大值,Pmin_week为周负荷最小值,Pavg_week为周负荷平均值;Pmax_month为月负荷最大值,Pmin_month为月负荷最小值,Pavg_month为月负荷平均值;Pmax_season为季负荷最大值,Pmin_season为季负荷最小值,Pavg_season为季负荷平均值;
周,月,季的数据为当前日期的前7天,前31天,前63天的数据窗口统计量;
c)负荷峰谷特征
定义日峰时间段为早上8点-晚上21点共14个小时,日谷时间段为晚上22点-第二天早上7点共10个小时;基于一天内的24个小时每个小时的用电负荷,计算峰谷特征;
日峰负荷,日谷负荷日均线:为单日日峰期间负荷均值,和单日日谷期间负荷均值特征,即[Ppeak_day,Pvalley_day]=[sum(P8,…,P21)/14,sum(P22,…,P7)/10];
日峰负荷,日谷负荷周均线:为一个周的日峰期间负荷均值,和一个周的日谷期间负荷均值,即[Ppeak_week,Pvalley_week]=sum(P8_1,…,P21_7)/14/7,sum(P22_1,…,P7_7)/10/7];这里Pn_m为一周中第m天的第n个数据点;
日峰负荷,日谷负荷月均线:为一个月的日峰期间负荷均值,和一个月的日谷期间负荷均值,即[Ppeak_month,Pvalley_month]=[sum(P8_1_,…,P21_31_)/14/31,sum(P22_1_,…,P7_31_)/10/31];这里Pn_k_为一个月中第k天的第n个数据点;
日峰负荷,日谷负荷季均线:为一个季的日峰期间负荷均值,和一个季的日谷期间负荷均值,即[Ppeak_season,Pvalley_season]=[sum(P8_1_1,…,P21_31_3)/14/31,sum(P22_1_1,…,P7_31_3)/10/31/3];这里Pn_k_s为一季度中第s个月第m天第n个数据点;
负荷峰谷特征为8维;同样为当前日期的前7天,前31天,前63天的数据窗口统计量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司;国网浙江省电力有限公司营销服务中心;浙江华云信息科技有限公司;国家电网有限公司,未经国网浙江省电力有限公司;国网浙江省电力有限公司营销服务中心;浙江华云信息科技有限公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210134165.2/1.html,转载请声明来源钻瓜专利网。