[发明专利]基于批流统一数据聚类的风电机组异常检测方法有效
申请号: | 202011519463.0 | 申请日: | 2020-12-21 |
公开(公告)号: | CN112651617B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 郭昆;戴锦坤;陈羽中;陈豪 | 申请(专利权)人: | 福州大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/00;G06Q50/06;G06F16/22;G06F16/2455;G06F16/2458;G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈明鑫;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 统一 数据 机组 异常 检测 方法 | ||
本发明涉及基于批流统一聚类模式的风电机组异常数据检测方法,将批量聚类和增量聚类结合。使用批量的聚类初始化方式,在首个时间窗口中初始化簇特征。后续窗口采用增量式的聚类方法,这样能够同时满足批量聚类的高精度以及流式聚类的低延迟等特点,可以持续处理大规模持续流入的风电机组群运行数据,并能较快地反映出异常数据所在设备。加入了基于流式迭代的簇特征更新机制。引入迭代流的思想,将风电机组数据簇特征创建成迭代流。进行流式的数据状态广播、双流连接计算,即将两个流式数据进行连接后计算。根据数据的最近簇进行分区,窗口定时更新每个分区的簇特征并将其返回到迭代流中。本发明保证了实时流处理低延迟的特性。
技术领域
本发明涉及风电机组异常检测领域,具体涉及一种基于批流统一数据聚类的风电机组异常检测方法。
背景技术
风能是一种环境友好且经济实用的可再生能源。中国是世界排名第一的风力发电国家、新装风力发电设备装机容量最大的国家,并且保持着持续的增长。因此,风电场数量和规模不断扩大,然而受地理条件和环境因素限制,风电场多位于偏僻遥远的平原、山区或海上,风电机组受设备、环境、运行状态等因素影响,系统实时采集的风机运行数据会存在有大量异常值和缺失值,这些数据的存在严重影响后续的风电机组状态分析、故障诊断等功能。因此,能够实时并快速地识别并排除风电机组的异常数据具有重要的探究意义。
随着计算机和物联网设备的普及,各类网络应用逐渐在泛化,由此产生了大量多源、异构的流式数据,包括大量保存在分布式文件系统的静态数据以及海量具有时效性的实时数据源。聚类作为一种无监督学习方法,可以对相似的数据进行聚类,从而挖掘数据隐藏价值。但大多数聚类只能处理单一类型的数据,无法适用于多元化的批量和流式数据。所以,如何有效统一处理批量的静态数据和实时的流式数据,如何实现满足批量、增量、流式的统一聚类算法,也是聚类的一个发展方向。
批量聚类算法主要解决批量数据的聚类问题,它将数据全部获取后再进行聚类分析。但由于内存大小、磁盘空间的限制,很多数据无法一次性获取。这样就出现了增量聚类算法,增量聚类算法能够对后来的数据进行增量式的计算更新,解决了传统聚类算法需要全量计算的缺陷。但随着社会发展,大量数据不断从网络、传感器以及网站点击等场景实时产生,数据时效性成为大数据非常重要的标签。为了适应实时产生的数据处理问题,出现了许多的流式聚类算法,典型代表包括基于层次的CluStream算法,基于网格密度的DenStream算法。流式聚类模型虽然设计了对流式数据快速处理的方法,但这无法有效的支持批量数据高精度的聚类分析。
发明内容
有鉴于此,本发明提供一种基于批流统一数据聚类的风电机组异常检测方法,应用于风电机组运行过程中产生的异常数据的检测,既能够通过批处理保证结果的准确性,又能够通过流式增量聚类来保证低延迟性。
为实现上述目的,本发明采用如下技术方案:
一种基于批流统一数据聚类的风电机组异常检测方法,包括以下步骤:
步骤S1:获取实时的风电机组数据,包括风电机运行时时间数据及传感器的记录数据;
步骤S2:将得到的风电机组数据划分为滑动时间窗口,每次处理一个时间窗口中的数据;
步骤S3:根据划分窗口预处理后的数据,初始化簇中心,提出融合了数据的批量处理和流式处理的批流统一聚类模型和簇特征更新机制,并在此基础上设计批流统一的聚类算法,以得到风电机组数据的批量和流式聚类结果;
步骤S4:对聚类生成的每个簇的大小进行判断,若簇内数据记录数小于预设阈值,则判断该簇为可能存在异常数据的簇,输出簇内数据记录,并将这些数据记录对应的风电机标记为可能存在异常的风电机,输出这些风电机的编号。
进一步的,所述风电机组批流数据为来自文件系统、消息队列、网络的多源数据,数据内容具体包括:数据记录时间及传感器记录的风速(m/s)、功率(kW)、转速(r/min)等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011519463.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于智能化纺织车间的吸尘器的功率智能控制方法
- 下一篇:一种多重检测贴片机
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置