[发明专利]一种基于相似性度量的水文数据异常模式检测方法在审
申请号: | 201910784182.9 | 申请日: | 2019-08-23 |
公开(公告)号: | CN110569890A | 公开(公告)日: | 2019-12-13 |
发明(设计)人: | 万定生;张祥 | 申请(专利权)人: | 河海大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/50 |
代理公司: | 32204 南京苏高专利商标事务所(普通合伙) | 代理人: | 柏尚春 |
地址: | 210024 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 序列模式 相似性度量 水文数据 异常模式 子序列 算法 检测 异常分数 关键点 分段 加权距离 平均距离 数据分析 异常因子 直线拟合 倒数 切割 | ||
1.一种基于相似性度量的水文数据异常模式检测方法,其特征在于:所述方法基于关键点的分段线性表示法KPRA-PLR算法、时间序列模式相似性度量的方法和基于k-近邻局部异常检测算法,包括如下步骤:
(1)基于关键点的分段线性表示法KPRA-PLR算法:首先根据关键点的定义对原始水文时间序列进行分割,得到每一段子序列,然后根据PLR算法对每段子序列进行直线拟合,得到直线的斜率,解出相邻两条直线间的交点,得到每个子序列起始时刻til和终止时刻tir,用(ai,til,tir)表示每一段子序列又称元模式;
(2)时间序列模式相似性度量的方法:将相邻元模式之间组合为序列模式;在度量两个模式相似性时,建立两个模式之间的相似性距离度量函数,用距离大小表示两者之间的相似度,每一模式的平均相似度代表该模式的异常分数;
(3)k-近邻局部异常检测算法:用异常分数值表示该模式的k-近邻距离,得出k-近邻局部可达距离、局部可达密度、局部异常因子,最大的异常因子为异常模式。
2.根据权利要求1所述的基于相似性度量的水文数据异常模式检测方法,其特征在于:步骤(1)包括如下过程:
(11)将关键点定义为S={s1,s2,…,sm}为时间序列X的所有局部极值点,当极值点sk满足|sk-sk-1|<ε且|tk-tk-1|<δ时,其中ε和δ为给定的常数,tk表示各个水文物理量的观测时间,则称sk为非重要局部极值点,集合S中其他极值点为关键点;
(12)根据线性分段表示算法,通过相邻两个关键点用最小二乘法拟合直线,得到直线对应的斜率,解出相邻两条直线间的交点,得到每个子序列起始时刻和终止时刻til和tir;每个子序列的模式表示为(ai,til,tir)称为元模式;
(13)通过调整参数,根据得到的拟合直线和原曲线形态吻合程度确定适合当前数据的常数ε和δ值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910784182.9/1.html,转载请声明来源钻瓜专利网。