[发明专利]一种基于混合聚类的电力设备并行故障诊断方法及装置在审
申请号: | 202210791423.4 | 申请日: | 2022-07-07 |
公开(公告)号: | CN115293236A | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | 刘少伟;戴必翔;秦昌嵩;董贝;经周 | 申请(专利权)人: | 南京国电南自电网自动化有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/2455 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 钟昕宇 |
地址: | 211153 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混合 电力设备 并行 故障诊断 方法 装置 | ||
本发明提供一种基于混合聚类的电力设备并行故障诊断方法及装置,能够实时的完成相应流式数据的并行诊断,实时满足监测数据的故障诊断,及时发现电力设备的故障。本方法包括以下步骤:根据历史电网数据自适应配置storm平台中各个组件的并行度和相关进程数;通过IRichSpout接口将实时电网数据接入到storm平台的Spout源组件中,形成待处理数据流;按照时间顺序将待处理数据流封装到多个Tuple元组中,并为每个Tuple元组生成唯一的ID;利用PreBolt组件接收Tuple元组,并通过标准分数法对Tuple元组中的数据集进行预处理,得到标准化样本;利用故障诊断模型处理标准化样本,获得电力设备的故障诊断结果。
技术领域
本发明属于电网电力行业多元数据监测诊断领域,涉及一种基于混合聚类的电力设备并行故障诊断方法及装置。
背景技术
随着电力系统的发展,电力设备故障对人们生活造成重大影响,因此亟需对设备的状态进行持续监测。而传感器技术和通信技术的不断进步,导致电网数据以指数级增长,同时这些数据呈实时性、易失性和无限性,是需要持续监测的流式数据。原有平台Hadoop可以处理批量数据,但实时性较差,而Storm是开源的分布式实时计算架构,可以快速处理海量数据流,弥补了Hadoop实时性处理的不足。
当前,随着Storm的兴起,其在电力行业领域出现一些应用成果。在Storm上实现基于时间的滑动窗口处理方法,并通过阈值判断实现电网数据流的异常检测。对电网设备中报警数据进行快速处理,通过聚类算法实现相关数据流的处理。
减法聚类算法和K-means算法属于机器学习算法,机器学习算法可以分为有监督学习和无监督学习两种。在现实世界中,大部分样本是不带标签的,因此无监督学习比监督学习应用更加广泛。K-means算法属于典型的无监督学习聚类算法,其初始聚类中心的选择为随机初始化,因此其聚类结果的准确性不稳定。
发明内容
本发明的目的在于克服现有技术中的不足,提供一种基于混合聚类的电力设备并行故障诊断方法,能够实时的完成相应流式数据的并行诊断,实时满足监测数据的故障诊断,及时发现电力设备的故障。
为达到上述目的,本发明是采用下述技术方案实现的:
第一方面,本发明提供了一种基于混合聚类的电力设备并行故障诊断方法,包括以下步骤:
根据历史电网数据自适应配置storm平台中各个组件的并行度和相关进程数;
通过IRichSpout接口将实时电网数据接入到storm平台的Spout源组件中,形成待处理数据流;
按照时间顺序将待处理数据流封装到多个Tuple元组中,并为每个Tuple元组生成唯一的ID;
利用PreBolt组件接收Tuple元组,并通过标准分数法对Tuple元组中的数据集进行预处理,得到标准化样本;
利用故障诊断模型处理标准化样本,获得电力设备的故障诊断结果。
进一步的,自适应配置storm平台中各个组件的并行度和相关进程数的方法为:
利用历史电网数据模拟实时电网数据流,其中,历史电网数据的流量大于实时电网数据的预期流量;
根据历史电网数据计算storm平台中各个组件在不同并行度和不同进程数下的数据吞吐量;
在数据吞吐量满足预期吞吐量的情况下,自适应配置开销最低的组件并行度和进程数。
进一步的,通过标准分数法对Tuple元组中的数据集进行预处理,得到标准化样本,包括:
按照下述公式对其进行归一化,公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京国电南自电网自动化有限公司,未经南京国电南自电网自动化有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210791423.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种过滤密封装置及合成反应釜
- 下一篇:一种探针