[发明专利]一种基于K-MEANS算法的配电网云平台数据校验方法有效
申请号: | 202011491009.9 | 申请日: | 2020-12-17 |
公开(公告)号: | CN112598041B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 郭江;朱文强;黄思旭;章芳情;刘洋;李立生;张林利;张世栋 | 申请(专利权)人: | 武汉大学;国网山东省电力公司电力科学研究院 |
主分类号: | G06F18/23213 | 分类号: | G06F18/23213;G06F18/22 |
代理公司: | 北京汇泽知识产权代理有限公司 11228 | 代理人: | 吴静 |
地址: | 430072*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 means 算法 配电网 平台 数据 校验 方法 | ||
一种基于K‑MEANS算法的配电网云平台数据校验方法,包括:根据配电网云平台数据构成配网数据集;计算配网数据集中任意两个数据对象之间的距离,根据任意两个数据对象之间的距离,获取第一、第二和第三初始聚类中心;根据第一、第二和第三初始聚类中心,确定初始聚类中心个数,并计算初始聚类中心的两两距离值,根据两两距离值确定第一阈值;对待检测的配网数据集进行聚类,计算每个数据对象到各个聚类中心的距离绝对值;采用第一规则对每个数据对象到各个聚类中心的距离绝对值进行判断,当待检测数据集中所有对象分类完成后,重新计算聚类中心;对重新计算聚类中心进行判断。本发明解决了配电网云平台多源数据不统一,难以进行清洗、剔除和校验的问题。
技术领域
本发明涉及的是数据校验领域,特别涉及一种基于K-MEANS算法的配电网云平台数据校验方法。
背景技术
随着智能配电网建设工作的不断深入和持续推进,配电自动化作为配电网运行管理的基础平台,在提高供电可靠性、提升配网精益化管理水平方面发挥了重要作用,但随之而来的配电自动化的运维管控问题也开始逐渐显现。主要表现在配网自动化系统采集的运行监控数据种类繁多且数量巨大,跨区域、跨平台间数据交互能力弱,省级配电网运行状态管控系统服务构建不灵活、多异构系统间信息融合度低。
由于电网的设备数据、运行数据以及管理数据等相关业务数据具有规模大、数据结构繁杂的特点,且数据涉及到电网公司的多个部门、多个系统,因此彼此之间的数据会出现大量冗余、不一致或缺失的情况。这些数据的来源种类繁多,包括SCADA系统、生产管理系统(PMS)、地理信息系统(GIS)、电能质量监测系统等,各个系统之间需求不同,数据类型、格式和精度等也存在较大差异,这些异构多源数据并不统一,需进行清洗、剔除和校验,否则各个数据源在实际应用场景中难以相互支撑,将制约配电网数据在配电网运行决策中的应用。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于K-MEANS算法的配电网云平台数据校验方法。
为了解决上述技术问题,本申请实施例公开了如下技术方案:
一种基于K-MEANS算法的配电网云平台数据校验方法,包括:
S100.获取配电网云平台数据中的数据对象个数,并将获取的对象构成配网数据集;
S200.计算配网数据集中任意两个数据对象之间的距离,根据任意两个数据对象之间的距离,获取第一、第二和第三初始聚类中心
S300.根据第一、第二和第三初始聚类中心,确定初始聚类中心个数,并计算初始聚类中心的两两距离值,获取两两距离值中的最大值,根据两两距离值中的最大值确定第一阈值;
S400.对待检测的配网数据集进行聚类,计算每个数据对象到各个聚类中心的距离绝对值;
S500.采用第一规则对每个数据对象到各个聚类中心的距离绝对值进行判断,当待检测数据集中所有对象分类完成后,重新计算聚类中心;
S600.如果聚类中心发生了改变,则重新执行S400-S600,重新对数据集进行聚类,并重新计算每个聚类这种的所有数据对象到新聚类中心的相似度;如果聚类中心未发生改变,输出所得到的聚类结果。
进一步地,S100中,当得到配网数据集后,采用马氏距离方法识别和校验出离群点,并将离群点进行剔除,得到优化后的配网数据集。
进一步地,S200中,获取距离最大值所对应的两个数据对象作为第一初始聚类中心。
进一步地,获取所有距离的中位数值所对应的数据对象作为第二初始聚类中心。
进一步地,S200中,计算数据集所有距离的平均值,将平均值所对应的数据对象确定为第三初始聚类中心;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学;国网山东省电力公司电力科学研究院,未经武汉大学;国网山东省电力公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011491009.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于云平台的配电网模型校验方法
- 下一篇:一种展会入场处理方法和装置