[发明专利]电网用户分组方法、装置、存储介质及电子设备在审
申请号: | 202010502136.8 | 申请日: | 2020-06-04 |
公开(公告)号: | CN111860574A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 吴辉;宋小松;刘爱锋;肖胡颖;朱超;张锦霞;张柏松 | 申请(专利权)人: | 远光软件股份有限公司;远光能源互联网产业发展(横琴)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/06;G06F16/2455 |
代理公司: | 广东朗乾律师事务所 44291 | 代理人: | 杨焕军 |
地址: | 519000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电网 用户 分组 方法 装置 存储 介质 电子设备 | ||
本申请实施例公开了一种基于模糊K均值聚类算法的电网用户分组方法、装置、存储介质及电子设备,本申请针对不同属性对聚类贡献度不同的问题,提出了引入信息增益加权属性的层次聚类算法,该算法利用层次聚类算法优点,通过对负荷数据的各个属性加权,从而提高了聚类算法的性能。
技术领域
本申请涉及机器学习领域,尤其涉及一种基于模糊K均值聚类算法的电网用户分组方法、装置、存储介质及电子设备。
背景技术
随着智能电表的大量安装部署和用电信息采集系统的广泛应用,电力公司与用户间的交流逐步加强,用户可以实时的了解用电和缴费信息,通过对数据的挖掘与分析,不但可以对电力客户的用电特性深入了解,而且可以设计更加安全、可靠的电力需求响应系统和短期负荷预测系统等。居民的日常生活负荷数据中隐藏着用户的用电行为习惯,对这些负荷数据进行分析与挖掘并研究用户类型,可以帮助电力公司准确地了解用户的个性化、差异化服务需求,从而使电力公司加强业务拓展的深度和广度,为未来的电力需求侧响应政策的制定提供强有力的数据支撑。
发明内容
本申请实施例提供了一种基于模糊K均值聚类算法的电网用户分组方法、装置、存储介质及电子设备,可以针对不同属性对聚类贡献度不同的问题,提出了引入信息增益加权属性的层次聚类算法,提高聚类算法的性能。所述技术方案如下:
第一方面,本申请实施例提供了一种基于模糊K均值聚类算法的电网用户分组方法,所述方法包括:
获取多个电网用户的负荷数据;其中,所述负荷数据包括多个属性;
计算多个属性中各个属性的权重;
基于模糊K均值聚类算法和权重对所述多个电网用户的负荷数据进行聚类分析得到多个分组;
其中,负荷数据xi和负荷数据xj之间的相异度为:
模糊K均值聚类算法的目标函数为n为负荷数据的数量,c为分组的数量,uki为第i个负荷数据隶属于第k个分组的程度,参数为模糊因子,vk为第k个分组的质心;
计算隶属度uki的公式为:
迭代时,对于第k个质心vk的第j(1≤j≤p)个连续属性Akj的公式为:
组内属性离散度|ck|表示第k个分组中负荷数据的数量;
组间属性离散度c表示分组的数量;
第i个属性的权重为:
所述多个分组的信息熵为:X表示多个电网用户的负荷数据,pi为X中的负荷数据属于第i分组Ci的概率。
第二方面,本申请实施例提供了一种基于模糊K均值聚类算法的电网用户分组装置,所述装置包括:
获取单元,用于获取多个电网用户的负荷数据;其中,所述负荷数据包括多个属性;
计算单元,用于计算多个属性中各个属性的权重;
分组单元,用于基于模糊K均值聚类算法和权重对所述多个电网用户的负荷数据进行聚类分析得到多个分组;
其中,负荷数据xi和xj之间的相异度为:模糊K均值聚类算法的目标函数为n为负荷数据的数量,c为分组的数量,uki为第i个负荷数据隶属于第k个分组的程度,参数为模糊因子,vk为第k个分组的质心;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于远光软件股份有限公司;远光能源互联网产业发展(横琴)有限公司,未经远光软件股份有限公司;远光能源互联网产业发展(横琴)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010502136.8/2.html,转载请声明来源钻瓜专利网。