[发明专利]一种自适应且分布无关的时间序列异常点检测方法在审
申请号: | 201511029681.5 | 申请日: | 2015-12-31 |
公开(公告)号: | CN105678409A | 公开(公告)日: | 2016-06-15 |
发明(设计)人: | 郑德权;张姝;孟遥;李风环;赵铁军;朱聪慧;杨沐昀;徐冰;曹海龙 | 申请(专利权)人: | 哈尔滨工业大学;富士通株式会社 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 杨立超 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 分布 无关 时间 序列 异常 检测 方法 | ||
1.一种自适应且分布无关的时间序列异常点检测方法,其特征在于它按以下步骤进行:
一、异常点的定义:
异常点是和其它子序列极度不一致,且不处于统计控制状态的子序列,处于统计控制状 态的时间子序列叫做受控数据或正常数据,否则,叫做失控数据或异常数据;时间序列中的 异常点通过数据的幅度变化或者时间序列的波形变化来确定,因此异常点分成两类:幅度异 常点和形状异常点;
二、时间序列特征化:
时间序列异常点检测的研究对象是子序列,时间序列X=X1,X2,...,Xn是实数变量X在不同的 时间点1,…,n取值的有序序列,其中n是时间点的个数,Xi是第i个观察值或子序列,Xi是长度 为q的子序列或q个特征的集合,因此时间序列表示成n×q的矩阵;
三、相似度和异常度确定:
异常点检测算法的一个关键要素就是决定关于两个观察值匹配程度的相似度;Xi和Xj是时间点为i和j的一对子序列,每个时间点对应一个具有q个特征的集合,采用距离函数来 确定算两个子序列间的相似度,距离越大,两个子序列间的相似度越小;对于每个子序列, 将其与同一个时间序列中的其他子序列不一致的程度定义为异常度,异常度由一个子序列和 它的K最近邻的距离的均值来计算,K最近邻是和该子序列最相似的K个近邻的集合;
四、基于统计假设检验的检测:
本发明中的统计假设检验只考虑异常度很大的情况,因而是单侧假设检验,由于数据的 分布是未知的,不知道分布的参数,即不知道均值和标准差;根据异常度的定义,得到一个 子序列和它的K最近邻的距离的均值,同时这个子序列的标准差也能被计算;当检验统计量 服从正态分布,且参数是未知时,通常用无偏估计来代替这个参数,则检验统计量服从t分 布,T检验不需要已知的分布参数,本发明用样本均值和标准差来代替分布参数并构建统计 量以及拒绝域;
五、增强式模糊化过程:
增强式模糊化过程:第一次模糊化确定假设中的阈值θ,第二次模糊化确定拒绝域,同 时将不等式(≥,<)视为模糊谓词,为模糊化选择模糊集和隶属函数,在第一次模糊化过程中, 当两个隶属函数相同时,确定阈值θ的值,在第二次模糊化过程中,通过比较隶属函数,确 定拒绝域;
模糊集的交叠特征是通过隶属函数中的参数反应的,而好的隶属函数不但能反映模糊概 念的模糊特征,而且能清晰的表达客观实际内容,因此,模糊化中的参数基于这一原则进行 优化,参数K的优化通过训练数据最大化综合性能得到,而如果训练数据有限,参数K预先 设定,此时,算法是无监督的;
2.如权利要求1所述的一种自适应且分布无关的时间序列异常点检测方法,其特征在于 步骤三中,采用余弦距离函数来确定两个子序列间的相似度。
3.如权利要求1所述的一种自适应且分布无关的时间序列异常点检测方法,其特征在于 步骤三中,采用变分距离函数来确定两个子序列间的相似度。
4.如权利要求1所述的一种自适应且分布无关的时间序列异常点检测方法,其特征在于 步骤四中所述显著性水平α的值为0.05。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学;富士通株式会社,未经哈尔滨工业大学;富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511029681.5/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理