[发明专利]基于曲线均值聚类算法的边缘侧用电数据聚类方法及装置在审
申请号: | 202111327824.6 | 申请日: | 2021-11-10 |
公开(公告)号: | CN113987308A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 李聪利;张志东;杨滨;闫龙;王斌;张恩杰;李达;陈雪振;乐坤;黄红军;宫博仁;李亚前;吴凯 | 申请(专利权)人: | 国网天津市电力公司;国家电网有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06F17/16;G06Q50/06 |
代理公司: | 天津才智专利商标代理有限公司 12108 | 代理人: | 庞学欣 |
地址: | 300010*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 曲线 均值 算法 边缘 用电 数据 方法 装置 | ||
本发明提供了一种基于曲线均值聚类算法的边缘侧用电数据聚类方法及装置,涉及用电数据聚类的技术领域,所述方法包括:获取第一用电日负荷数据,并对用电日负荷数据进行预处理以获取第二用电日负荷数据;对第二用电日负荷数据进行低秩性分析和奇异值计算,并采用肘方法确定最优簇数;基于最优簇数对第二用电日负荷数据采用K均值聚类算法进行聚类。通过本发明可以在边缘侧对用电数据进行聚类,为基于边‑云协同的电力高级应用提供强有力的支撑。
技术领域
本发明涉及用电数据聚类的技术领域,尤其是涉及一种基于曲线均值聚类算法的边缘侧用电数据聚类方法及装置。
背景技术
随着电网智能化、数字化建设的推进,基于边-云协同的电力高级应用不断增加。边缘计算技术将计算力下放至近电力终端物理设备和数据源侧,基于边缘计算节点自主快速对数据进行处理分析,满足电力信息系统对海量数据快速处理的需求,支撑智能电网高级应用。其中,边缘侧营销大数据蕴含着丰富的用电信息,而海量多源多维度数据难以发现其内在规律,为此,通过对海量多源用电数据进行聚类分析,将用电行为习惯相似的电力用户进行归类,提升电网精益化运营,为人工智能高级应用提供基础。
发明内容
有鉴于此,本发明的目的在于提供一种基于曲线均值聚类算法的边缘侧用电数据聚类方法及装置,以在边缘侧对用电数据进行聚类,为基于边-云协同的电力高级应用提供强有力的支撑。
本发明提供了一种基于曲线均值聚类算法的边缘侧用电数据聚类方法,具体按照如下步骤进行:
获取第一用电日负荷数据,并对所述用电日负荷数据进行预处理以获取第二用电日负荷数据;
对所述第二用电日负荷数据进行低秩性分析和奇异值计算,并采用肘方法确定最优簇数;
基于所述最优簇数对所述第二用电日负荷数据采用K均值聚类算法进行聚类。
优选的,所述方法还包括:
获取聚类的簇内平均距离、簇间平均距离以及DI指数以对聚类结果进行评价。
优选的,所述对所述第二用电日负荷数据进行低秩性分析和奇异值计算的步骤包括:
采用如下公式进行低秩性分析和奇异值计算:
L=UΣVT
U—m×m阶酉矩阵;
∑—m×n阶非负实数对角矩阵;
V—n×n阶酉矩阵。
优选的,所述对所述用电日负荷数据进行预处理以获取第二用电日负荷数据的步骤包括:
删除所述第一用电日负荷数据含缺失值的数据,并对所述第一用电日负荷数据进行归一化处理。
优选的,所述对所述第二用电日负荷数据进行低秩性分析和奇异值计算,并采用肘方法确定最优簇数的步骤包括:
采用如下公式获取两对象之间的距离:
d=1-|ρ|
ρ—相关系数;
相关系数采用如下公式计算:
基于相关系数获取rSSE与簇数C关系曲线以获取最优簇数基于相关系数获取rSSE与簇数C关系曲线以获取最优簇数;
k—总簇数;
ni—第i个分簇的对象数量;
dij—第i个分簇中,第j个对象与该簇质心的距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网天津市电力公司;国家电网有限公司,未经国网天津市电力公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111327824.6/2.html,转载请声明来源钻瓜专利网。