[发明专利]一种火电厂制粉系统数据中异常数据的检测方法有效
申请号: | 201510227457.0 | 申请日: | 2015-05-06 |
公开(公告)号: | CN104809662B | 公开(公告)日: | 2018-03-16 |
发明(设计)人: | 曹晖;苑易伟;张彦斌;贾立新;司刚全 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06Q50/06 | 分类号: | G06Q50/06;G06F17/30 |
代理公司: | 西安智大知识产权代理事务所61215 | 代理人: | 何会侠 |
地址: | 710049*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 火电厂 制粉 系统 数据 异常 检测 方法 | ||
技术领域
本发明一种火电厂制粉系统中数据处理的方法,具体涉及一种火电厂制粉系统数据中异常数据的检测方法。
背景技术
制粉系统是火力发电厂的主要辅助系统之一,为了保证其运行安全和运行效率,数据挖掘技术被应用在制粉系统的分析及控制上。由于制粉系统的数据不可避免的存在不完整、不一致的脏数据,无法直接进行数据挖掘,因此我们需要对制粉系统的数据进行清洗。
目前大多采用异常数据检测算法来识别被认为被污染了的脏数据。异常数据检测算法为每个数据赋予一个异常因子,异常因子值高于设定阈值的数据被认为是异常数据。常见的异常数据检测算法有LOF算法和COF算法。LOF算法由人工选择MinPts参数来确定对象的近邻个数以及MinPts近邻距离,由此计算对象的局部密度。LOF值是对象局部密度和近邻的平均局部密度之间的比值。因此,对象的局部密度越低并且近邻的局部密度越高,那么对象的LOF值越高。COF算法计算每个对象的链接异常程度COF值来表示对象的异常程度,COF值是对象平均链接距离和对象的MinPts近邻的平均链接距离的平均值之间的比值。还有一些经过改进的异常数据检测算法,但这些算法都不能很好地区分正常数据集边缘的对象和异常数据,并且MinPts的选取会影响到异常数据检测的结果。
由于自身的局限性,上述算法对火电厂制粉系统的数据的异常数据检测结果并不理想,导致火电厂制粉系统的数据挖掘结果不准确。
发明内容
为了解决上述现有技术存在的问题,本发明提供一种火电厂制粉系统数据中异常数据的检测方法,基于最小球计算密度,实现对制粉系统的工作数据进行检测分析并判断是否为异常数据,以提高对火电厂制粉系统的数据挖掘的效果。
为了达到上述目的,本发明采用如下技术方案:
一种火电厂制粉系统数据中异常数据的检测方法,步骤如下:
步骤1:首先火电厂制粉系统采集信号数据构成现场历史数据库D,该数据库D包括六个变量:磨机负荷、磨机出入口压差、磨机入口负压、磨机出口温度、粗粉分离器出口负压和细粉分离器出口负压;这样,数据库D是一个六维数据库;这里设定正整数k为12(k≥6);计算数据集D中对象两两之间的距离并且确定出每个对象p的k近邻NNk(p);
对任意的自然数k,定义p的k-距离为p和某个对象o之间的距离d(p,o),这里的o满足:
(1)至少存在k个对象o′∈D/{p},使得d(p,o′)≤d(p,o),并且
(2)至多存在k-1个对象o′∈D/{p},使得d(p,o′)<d(p,o);
p的k近邻包含所有与p的距离不超过k-距离的对象;这样p的k近邻的个数可能比k大;
步骤2:火电厂制粉系统通过步骤1得到p的k近邻NNk(p),将近邻NNk(p)按照距离p的远近进行排序,构成距离近邻序列NNS(p)={p,c1,c2,……,cr},这里r=|NNk(p)|,ci∈NNk(p),i=1,2,……,r;步骤2是一个反复计算的过程,NNS(p)的初始值是{p};在每次计算时,算法不断从NNk(p)剩下对象中找到距离p最近的数据,并把找出的对象加到NNS(p)中去;如果找到的对象不只一个,则根据事先排好的对象顺序加到NNS(p)中去;在每次计算完毕后,更新NNS(p)信息后再进行下一次计算;当NNk(p)中所有对象都被陆续加入到NNS(p)后,该步骤结束;
步骤3:火电厂制粉系统根据步骤2所得NNS(p)计算所有数据的最小球;根据包含p的k-距离近邻的最小球,计算p的空间密度;最小球是包含NNS(p)中所有数据的球中半径最小的那个球;对于2维数据来说,最小球是一个圆,而3维数据的最小球是球体,3维以上的最小球是超球;
最小球求解问题转变为求下列方程组的最优解问题:
O是最小球球心,R是最小球半径;
步骤4:火电厂制粉系统得到所有点的最小球的半径之后,对象p的空间密度表示为:
这里|NNS(p)|是NNS(p)中的数据个数,R(p)是最小球半径;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510227457.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置