[发明专利]一种基于密度聚类的在线野值检测、识别与修正方法在审
申请号: | 201910434499.X | 申请日: | 2019-05-23 |
公开(公告)号: | CN110188810A | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 马艳;王凯 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G01R33/02 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 刘新琼 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 修正 密度聚类 邻域 正常信号 数据点 野值点 多项式拟合 采集数据 全部信号 时刻数据 边界点 点检测 连续型 检测 渐变 重复 更新 | ||
1.一种基于密度聚类的野值检测、识别与修正方法,其特征在于步骤如下:
步骤1:测量并采集数据序列(D1,D2,…,DN)={(B1,t1),(B2,t2),…,(BN,tN)},其中t代表时间坐标,B代表幅值大小;
步骤2:计算密度聚类参数:邻域半径和密度阈值:
首先计算输入信号中前Ng个信号点Di中每个数据点到其他数据点的距离,i=1,2…Ng:
得到一系列由lij组成的l;
其次计算邻域半径ε:
ε≥mean(l)+k′·std(l) (1)
其中mean(l)为对l求平均值,std(l)为l的方差;k′为大于0常数;
最后计算密度阈值MinPts,在邻域半径ε确定后,统计上述每个点的前半邻域内点的个数Mi,所述的前半邻域指某点Di邻域以该点时间ti为间隔划分为前、后两半中的前一半,其中前半为t<ti、后半为t>ti;计算密度阈值:
步骤3:计算当前tk时刻数据点Dk(Bk,tk)前半邻域内数据点个数Mk;计算该点到已知点,即t<tk的点间的距离,如果距离小于邻域半径ε,那么就属于数据点Dk(tk,xk)半邻域内的数据点;
步骤4:将步骤3的邻域半径内数据点个数Mk与步骤2的密度阈值MinPts进行比较:如果Mk≥Minpts,Dk为正常信号核心点;如果0<Mk<Minpts且邻域内有正常信号核心点,Dk为正常信号边界点;如果0≤Mk<Minpts且邻域内无正常信号核心点,Dk为野值点;
步骤5:如果当前点Dk为野值点,对Dk进行多项式拟合修正;
步骤6:对数据进行更新,获取下一时刻的数据,并重复步骤3~7,直至全部信号点检测和修正完成,得到修正后的数据。
2.根据权利要求1所述的一种基于密度聚类的野值检测、识别与修正方法,其特征在于步骤2中所述的Ng=400。
3.根据权利要求1所述的一种基于密度聚类的野值检测、识别与修正方法,其特征在于步骤2中所述的k=3。
4.根据权利要求1所述的一种基于密度聚类的野值检测、识别与修正方法,其特征在于步骤5中所述的多项式拟合修正的具体方法如下:对tk时刻前共计Np个的数据段利用最小二乘法进行多项式拟合,所述的拟合数据段长度Np要在该段数据内符合信号变化趋势,同时多项式的次数一般不要超过3次;取Np=100,采用多项式次数为2次;拟合后的二次多项式为B′=a0t2+a1t1+a2,a0,a1,…,a2为拟合的多项式系数,带入t=tk可获得tk时刻野值点数据估计值Bk′=a0tk2+a1tk1+a2,用估计值Bk′对Bk进行替代,并将数据点Dk的数据类型从野值点修改为正常信号核心点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910434499.X/1.html,转载请声明来源钻瓜专利网。