[发明专利]一种基于时间序列聚类的电能表设备类别识别方法有效
申请号: | 201910401307.5 | 申请日: | 2019-05-14 |
公开(公告)号: | CN110321389B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 张磊;张前程;李越 | 申请(专利权)人: | 南京浦和数据有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F17/11;G06F18/23213 |
代理公司: | 南京新慧恒诚知识产权代理有限公司 32424 | 代理人: | 李晓静 |
地址: | 210038 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时间 序列 电能表 设备 类别 识别 方法 | ||
1.一种基于时间序列聚类的电能表设备类别识别方法,其特征在于,包括以下步骤:步骤S1:数据准备及预处理,电能表安装的数据字段,包括设备码、设备类别、安装时间、安装类型,重塑安装时间字段,以年-月为粒度构建特征“安装年月”,同时以安装时间、安装类型、设备类别聚合数据,形成数据输入表,所述字段包括安装类型、设备类别、安装年月、数量;步骤S2:电能表安装序列分解,通过确定趋势成分及其表示T、确定季节成分及其表示S和确定循环波动及其表示C,通过产生的T、S、C三个特征构建电能表安装时间序列数据集D;步骤S3:电能表安装序列分解特征聚类,按照电能表设备类别分簇,得到各个簇内的电能表即是具有相互替代关系目标设备码列表,包括以下具体步骤:步骤(1):从电能表安装时间序列数据集D中随机选择k个样本作为初始的k个质心向量:;步骤(2)对于n=1,2,……,N,将电能表设备类别簇C初始化为,t=1,2……,k;对于i=1,2……m,计算样本xi和各个质心向量uj的距离
,
将xi标记最小的dij所对应的类别λi,此时更新
,
对于j=1,2,……k,对Cj中所有样本点重新计算新的质心
,
若所有的k个质心向量都没有发生变化则转到步骤(3);
步骤(3):输出簇划分,其中各个簇内的电能表即是具有相互替代关系目标设备码列表。
2.根据权利要求1所述的基于时间序列聚类的电能表类别识别方法,其特征在于,所述电能表安装时间序列是长期趋势、季节变动、循环波动、不规则波动的叠加或耦合,其中不规则波动为噪声。
3.根据权利要求1所述的基于时间序列聚类的电能表类别识别方法,其特征在于通过线性回归的方式及最小二乘法的求解方法构建特征T,包括以下步骤:步骤(1):预设回归方程为,b0表示趋势线在Y轴上的截距;b1表示趋势线的斜率;t为某一时刻电能表的安装量;步骤(2):根据最小二乘法获取两个待定系数:
在α=0.05的显著性水平下检验回归方程,同时利用R2综合检验线性关系是否显著,利用回归系数b1作为T的特征表示。
4.根据权利要求1所述的基于时间序列聚类的电能表类别识别方法,其特征在于利用中心化移动平均值计算季节指数从而构造特征S,包括以下步骤:步骤(1):计算移动平均值,并对其结果采取中心化处理得出中心化移动平均值:
,
其中,i为年标记,j为季度标记,j=4;
步骤(2):计算移动平均的比值即季节比率,将序列的各观察值除以相应的中心化移动平均值,再计算出各比值的月度平均值:
,
R为季节比率;
步骤(3):将步骤(2)计算的比率平均值除以总平均值
,
S即为季节指数。
5.根据权利要求3所述的基于时间序列聚类的电能表类别识别方法,其特征在于利用移动平均及T分解循环波动从而构造特征C,通过以及T值来分解循环波动
,
其中,MA为移动平均值,C即为循环波动。
6.根据权利要求1所述的基于时间序列聚类的电能表类别识别方法,其特征在于,利用T,S,C构建特征集D,即
。
7.根据权利要求6所述的基于时间序列聚类的电能表类别识别方法,其特征在于利用特征集D,运用K-means聚类判断具有相互替代关系的电能表安装序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京浦和数据有限公司,未经南京浦和数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910401307.5/1.html,转载请声明来源钻瓜专利网。