[发明专利]基于批流统一数据聚类的风电机组异常检测方法有效
申请号: | 202011519463.0 | 申请日: | 2020-12-21 |
公开(公告)号: | CN112651617B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 郭昆;戴锦坤;陈羽中;陈豪 | 申请(专利权)人: | 福州大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/00;G06Q50/06;G06F16/22;G06F16/2455;G06F16/2458;G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈明鑫;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 统一 数据 机组 异常 检测 方法 | ||
1.一种基于批流统一数据聚类的风电机组异常检测方法,其特征在于,包括以下步骤:
步骤S1:获取实时的风电机组数据;
步骤S2:将得到的风电机组数据划分为滑动时间窗口,每次处理一个时间窗口中的数据;
步骤S3:根据划分窗口预处理后的数据,初始化簇中心,采用融合了数据的批量处理和流式处理的批流统一聚类模型UBSCM和簇特征更新机制,设计实现批流统一的聚类算法,得到风电机组数据的批量和流式聚类结果,所述聚类算法包括KMeansUBSP算法、KModesUBSP算法以及DBSCANUBSP算法;其中,采用基于UBSCM的DBSCANUBSP算法时,具体为:
(1):首先读取实时获取的风电机组数据的流式数据tuple,划分为滑动时间窗口,首个窗口的数据进行变形的密度聚类算法将每个点划分到簇中;
(2):采用公式(5)、(6)和(7),将划分后的点生成为初始化的潜在微簇,并创建一个公共微簇类用于存放和传递,在微簇对象中有一个成员变量作为标记,用于区分潜在微簇和离群微簇;
潜在微簇描述为当前时间为t的一组带有时间戳的点集,将其定义为离群微簇定义为
其中w是权重;β的取值范围是0β≤1;
(3):将微簇创建成迭代流,通过用于处理迭代流的process方法把所有微簇迭代流一起广播到随机分区,所述process方法是把数据点流归到最近的微簇中,根据微簇的标记进行区分,并创建两个列表结构的状态分别保存潜在微簇和离群微簇,在随机分区中潜在微簇和离群微簇会进行时间衰减,并根据权重进行互相转换;
(4):在后续窗口数据到达时,计算样本数据距离最近的潜在微簇和离群微簇,根据并入后微簇的半径与参数大小将点并入或创建新的微簇;
(5):最后将被更新的微簇传入迭代流中重新广播和迭代;
所述微簇传入迭代流中重新广播和迭代的方法具体为:
(1):首先计算更新时间间隔Tp,读取实时获取的风电机组数据的流式数据,对数据中的每个点进行尝试并入微簇;
(2):尝试将点p并入距离最近的潜在微簇,如果并入后潜在微簇的新半径小于等于∈则并入;
(3):否则尝试将点p并入距离最近的离群微簇,如果并入后离群微簇的新半径小于等于∈则并入,再判断离群微簇的新权重是否大于βμ,大于则将离群微簇转换成潜在微簇;如果并入后离群微簇的新半径大于∈,则使用点p创建一个新的离群微簇并将点插入到离群缓存中;
(4):根据参数计算更新时间间隔Tp,每隔Tp时间遍历潜在微簇和离群微簇,将权重小于βμ的潜在微簇和权重小于ξ的离群微簇删除;
(5):最后当一个聚类请求到达时根据密度聚类算法对潜在微簇进行聚类,得到最终聚类结果,再使用与之前密度聚类算法相同的判断方式对异常所在簇进行判断;
ξ的计算公式如公式(8)所示:
其中tc是当前时间,t0是潜在微簇的创建时间,当tc=t0时ξ=1;
步骤S4:对聚类生成的每个簇的大小进行判断,若簇内数据记录数小于预设阈值,则判断该簇为可能存在异常数据的簇,输出簇内数据记录,并将簇内数据记录对应的风电机标记为可能存在异常的风电机,输出风电机的编号。
2.根据权利要求1所述的基于批流统一数据聚类的风电机组异常检测方法,其特征在于,所述风电机组数据为来自文件系统、消息队列、网络的多源数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011519463.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于智能化纺织车间的吸尘器的功率智能控制方法
- 下一篇:一种多重检测贴片机
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置