[发明专利]一种基于特征指标降维的分布式双层聚类分析方法在审
申请号: | 201910947223.1 | 申请日: | 2019-09-30 |
公开(公告)号: | CN110659699A | 公开(公告)日: | 2020-01-07 |
发明(设计)人: | 李春燕;谢开贵;胡博;牛涛;张谦;王鑫;蔡文悦 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/06 |
代理公司: | 11275 北京同恒源知识产权代理有限公司 | 代理人: | 赵荣之 |
地址: | 400044 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类结果 站点 负荷曲线 局部站点 聚类算法 数据中心 聚类 上传 全局 分解 电力系统 负荷数据 聚类分析 聚类中心 数据降维 特征指标 行为分析 一次聚类 用户响应 用户用电 智能电表 复杂度 子数据 降维 转发 传输 反馈 客户 | ||
1.一种基于特征指标降维的分布式双层聚类分析方法,其特征在于:包括以下步骤:
S1:收集智能电表数据并传输到最近的局部站点,将大量负荷曲线按照所属站点分解为若干个规模较小、相互独立的子数据,对于本身负荷曲线较多的站点,可以进行进一步划分;
S2:对分解到各站点的负荷数据进行数据降维,并采用复杂度较低的聚类算法进行一次聚类,即局部聚类,对区域内不同客户进行聚类,得到聚类结果;
S3:将从不同局部站点获得的聚类结果,转发给全局数据中心进行二次聚类,并获得最终的聚类结果,其中转发的数据仅为聚类中心,而无需上传全部数据;
S4:全局数据中心将全局聚类结果反馈给每个本地站点,并进行用户用电行为分析。
2.根据权利要求1所述的基于特征指标降维的分布式双层聚类分析方法,其特征在于:步骤S2中,通过提取负荷曲线的时域特征和频域特征指标对数据进行降维处理,进而采用自适应kmeans聚类算法实现局部聚类。
3.根据权利要求2所述的基于特征指标降维的分布式双层聚类分析方法,其特征在于:采用的时域特征指标包括五个典型负荷特性指标,即峰时耗电率、谷电系数、平段用电百分比、日负荷率和日平均负荷,分别从不同时段、用电水平和变动情况等方面全面表征负荷曲线,其中:
峰时耗电率用于衡量用户在高峰时段的用电倾向,谷电系数用于衡量用户在低谷时段的用电倾向,平段用电百分比用于衡量用户在平峰时段的用电倾向,日负荷率用于衡量在规定时间内负荷变动情况,以及考核电气设备的利用程度,日平均负荷用于衡量在规定时间内负荷的平均水平,其中,Lp为高峰时段用电量,Lv为谷用电量,Lf为平段用电量,Lz为总用电量,Pav为日平均负荷,Pmax为日最大负荷;
根据指标变异性的大小来确定客观权重,通过评价各负荷特性指标对聚类的区分度大小,从而确定各指标的权重;评价规则如下:
1)根据经验或者专家打分对负荷特性指标设定初始权重λ=[λ1 λ2 ... λz],z为负荷曲线特征指标总数;
2)在每次生成新的聚类中心后,利用下式评价函数计算第i个特征指标对聚类中心的贡献度:
vij=λi(Xrandij-Cij)2,j=1,2,...,c (1)
其中,c为聚类中心数,Cij是第j个聚类中心的第i个负荷特性指标值,Xrandij代表在第j类中随机选择的负荷曲线对应的第i个负荷特性指标值,由于贡献度采用距离衡量,因此所述贡献度越小越好,所述贡献度形成的矩阵,即为针对c个评价对象的z个评价指标值的指标矩阵V=(vij)c×z;
3)通过式(2)-(4)计算第i个指标的客观权重,实现客观赋权:
对于权重有0≤λi′≤1,且
引入两个能够对负荷曲线进行有效降维的频域指标,频率-幅度对和谐波畸变程度;频率-幅度对是指将典型日负荷曲线经过快速傅里叶变换FFT变换后得到的第i个频率和对应幅值视为一组特征[fi,ci],根据幅值对“频率-幅度对”进行排序,得到经过排序后的“频率-幅度对”特征集为Ff=[{f1,c1},{f2,c2},...,{fn,cn}];取前n个“频率-幅度对”作为频域特征,进行聚类分析;谐波畸变程度是参考总谐波畸变率的定义并能够反映负荷曲线的最简特征集,其定义式如式(5):
其中,cm为前n个幅值的平均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910947223.1/1.html,转载请声明来源钻瓜专利网。