[发明专利]基于复合聚类算法的电力居民用户日负荷曲线聚类方法在审
申请号: | 201910983879.9 | 申请日: | 2019-10-16 |
公开(公告)号: | CN110781332A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 游文霞;金之榆 | 申请(专利权)人: | 三峡大学 |
主分类号: | G06F16/55 | 分类号: | G06F16/55;G06K9/62;G06Q10/04;G06Q50/06 |
代理公司: | 42103 宜昌市三峡专利事务所 | 代理人: | 吴思高 |
地址: | 443002 *** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类 聚类算法 日负荷 群集 初始聚类中心 居民用户 用户群 聚类中心 降维 样本 预处理 数据集矩阵 有效性指标 电力企业 降维处理 聚类结果 数据聚类 时间点 数据包 用电量 低谷 复合 评估 预测 高峰 分析 管理 | ||
1.基于复合聚类算法的电力居民用户日负荷曲线聚类方法,其特征在于包括以下步骤:
步骤1:获取电力居民用户日负荷数据,该数据包含有P个样本,每个样本有Q个时间点属性的数据集矩阵;
步骤2:对电力居民用户日负荷数据进行预处理,获得初始群集;
步骤3:对初始群集进行降维处理,获得降维群集;
步骤4:采用聚类算法1对降维群集进行初步聚类,得到初始聚类中心;
步骤5:采用聚类算法2对聚类算法1得到的初始聚类中心进行聚类,并使用聚类有效性指标,对聚类结果进行评估,最终得到M个聚类中心;
步骤6:采用步骤5得到的M个聚类中心,作为聚类算法2的初始聚类中心,对数据进行聚类,获得行为相似的用户群。
2.根据权利要求1所述基于复合聚类算法的电力居民用户日负荷曲线聚类方法,其特征在于:所述步骤1中,对于P个样本,每个样本有Q个时间点属性的电力居民用户日负荷数据集,包括:P个样本为居民用户样本,居民生活主要受季节变化、气温变化、收人水平、空调、电炊拥有率等因素影响,不用的因素会导致不同的日负荷曲线;Q为每日各个时间点由智能电表采集的该时间点的用电功率,Q的值根据智能电表采集数据的时间间隔而定。
3.根据权利要求1所述基于复合聚类算法的电力居民用户日负荷曲线聚类方法,其特征在于:所述步骤2中,预处理包括缺失值处理、数据标准化、数据正则化处理;
缺失值处理,对含有较多缺失值的数据进行删除,对含有较少缺失值的数据进行补全;
数据标准化,将原始数据线性化的方法转换到[0,1]的范围;
数据正则化处理,将每个属性减去该属性对应的均值,然后,再除以该属性对应方差。
4.根据权利要求1所述基于复合聚类算法的电力居民用户日负荷曲线聚类方法,其特征在于:所述步骤3中,降维处理采用PCA(Principal Component Analysis),即主成分分析方法;获取的降维集群为p个样本、每个样本有q个属性的数据集矩阵。
5.根据权利要求1所述基于复合聚类算法的电力居民用户日负荷曲线聚类方法,其特征在于:所述步骤4中,采用聚类算法1对降维群集做初步聚类,获得行为相似的用户群,具体包括,采用Mean-shift算法,将数据集中的p个样本聚成N类,其中,N为正整数。
6.根据权利要求1所述基于复合聚类算法的电力居民用户日负荷曲线聚类方法,其特征在于:所述步骤5中,采用聚类算法2对聚类算法1得到的聚类中心进行聚类,采用聚类有效性指标评估聚类结果,具体包括:采用K-means算法对Mean-shift算法得到的N个聚类中心进行聚类,在聚类数目N范围内,对[2,N]分别聚类,其中,N为正整数,并使用Calinski-Harabasz(CH)指标对聚类结果进行评估,选取CH值最大的结果,最终得到M个聚类中心,其中,M为[2,N]中的正整数。
7.根据权利要求1所述基于复合聚类算法的电力居民用户日负荷曲线聚类方法,其特征在于:所述步骤6中,采用得到的M个聚类中心作为K-means算法的初始聚类中心,对数据集中的每个样本,即每个用户或每条记录进行聚类,最后得到M个类的用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三峡大学,未经三峡大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910983879.9/1.html,转载请声明来源钻瓜专利网。