[发明专利]一种基于海量运行数据的在线故障诊断方法有效
申请号: | 201610551765.3 | 申请日: | 2016-07-13 |
公开(公告)号: | CN105930629B | 公开(公告)日: | 2017-09-05 |
发明(设计)人: | 江晓明;司风琪;任少君;王虎;张捷 | 申请(专利权)人: | 大唐南京环保科技有限责任公司;东南大学 |
主分类号: | G06F17/50 | 分类号: | G06F17/50;G06K9/62 |
代理公司: | 南京苏高专利商标事务所(普通合伙)32204 | 代理人: | 柏尚春 |
地址: | 211111 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 海量 运行 数据 在线 故障诊断 方法 | ||
技术领域
本发明涉及在线故障诊断技术领域,具体涉及一种基于海量运行数据的在线故障诊断方法。
背景技术
机器学习(Machine Learning)是从已知样本数据或信息中通过挖掘、归纳、演绎、类比等方法获取知识的手段和机制,它是继专家系统之后人工智能应用的又一重要研究领域,并引起广泛关注。机器学习的目的就是根据设计的某种方法或算法,对事先给定的训练样本进行学习,然后求取对某系统输入输出之间依赖关系的估计,并使该估计能够较好的对未知输出做出尽可能准确的预测或对其性质进行判断。
故障诊断不但是海量数据挖掘领域中的重要研究内容,在热工过程海量实时数据流处理中也是需要重点解决的问题。热工过程底层传感器通常工作在高温高压的复杂环境下,一旦测量传感器发生故障,必将造成系统相关计算分析错误,轻则是控制系统性能下降,重则有可能导致严重的事故,造成重大的经济损失,因此有必要对传感器测量数据的准确性进行实时验证,并对诊断出故障的传感器进行故障分类及故障值重构;此外,除了保证测量数据的准确之外,还要对热工过程各部件的运行状态进行实时监测及诊断。美国国家统计局曾做过统计:1980年美国用于设备的检修的费用为2460亿美元,而采用状态监测与故障诊断技术后,该项费用减少了1/3,合计约750亿美元;英国国有化企业在釆用状态监测和故障诊断技术之后,每年检修费用从35亿英镑锐减少到20亿英镑。可见,釆用故障检测和故障诊断技术可以大量减少事故发生率,节省维修费用,减少大量的直接和间接经济损失。基于数据驱动的人工智能技术是解决这一问题的有效方法,也是该领域的一个研究热点。
目前,研究者们对人工智能建模技术作了大量的研究,提出了多种改进算法,在一定程度上能够提高模型的学习能力。然而,人工智能模型的性能与训练样本的选取密切相关,样本集是否具有代表性,决定了模型的学习效果。如果样本集中的某个参数与其他参数数据相关性差,那么所建立的模型仅限于拟合有限训练样本间的关系,具有较差的泛化能力,无法满足实时诊断的要求,某些参数由于测量环境差或者目前的技术无法准确测量,导致测量值波动较大或与真实值偏离较大,即使与其他参数具有一定的机理关系,也无法从过程测量数据中识别出来,如果这些参数的历史测量数据参与模型建立,可能会降低诊断模型的精确度,还有基于过程数据的诊断模型一般通过机理关系确定模型参数,然而各类传感器之间存在差异,某些传感器由于测量环境恶劣或者测量技术无法满足测量要求,使得测量数据于真实值之间存在较大误差,导致这些参数的过程测量数据丧失了他们固有的机理关系,因此有必要对参数间的关系进行数据检验;另外,样本中存在的非稳态数据和冗余数据也会破坏诊断模型的精度,降低模型的学习能力和泛化能力,原始历史数据集中存在大量非稳态数据,由于测量延迟或过度期间中的工况波动,使得这些数据无法准确反映参数间的机理关系,还有稳态样本数据中存在大量的冗余数据,一方面增加了模型训练过程中计算量,降低了网络模型的计算速度,另一方面可能造成样本数据不平衡。此外,实时诊断过程中的非稳态数据不确定因素较多,很难保证变量间的关系符合严格的数学模型,将发生大量的误诊情况,严重影响了模型的有效性,因此,如何从海量数据中选取合适的样本对提高机器学习模型的实用性具有重要意义。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供了一种基于海量运行数据的在线故障诊断方法,考虑了模型训练过程中的样本选择问题和在线诊断过程的数据过滤问题,提高了诊断模型的可靠性。
技术方案:本发明提供的基于海量运行数据的在线故障诊断方法,包括如下步骤:
(1)优选样本:确定故障诊断模型样本参数,获取稳态样本数据,并剔除冗余样本数据;
(2)训练故障诊断模型:利用优选样本训练故障诊断模型;
(3)故障诊断:实时监测过程数据,进行标准化处理,并对处理后的数据流进行非稳态数据剔除,利用训练好的故障诊断模型对稳态数据进行传感器故障诊断,非稳态数据不作为判定传感器故障的依据。
某些参数由于测量环境差或者目前的技术无法准确测量,导致测量值波动较大或与真实值偏离较大,即使与其他参数具有一定机理关系,也无法从过程测量数据中识别出来,如果这些参数的历史测量数据参与模型建立,可能会降低诊断模型的精确度。因此,本发明在模型建立前对参数进行相关性分析,确保参数历史测量数据之间具有一定的相关性。样本参数确定的具体方法为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大唐南京环保科技有限责任公司;东南大学,未经大唐南京环保科技有限责任公司;东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610551765.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置