[发明专利]一种时间序列异常点的检测方法在审

专利信息
申请号: 201811410281.2 申请日: 2018-11-23
公开(公告)号: CN109542952A 公开(公告)日: 2019-03-29
发明(设计)人: 蔡喁 申请(专利权)人: 中国民用航空上海航空器适航审定中心
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/22
代理公司: 上海容慧专利代理事务所(普通合伙) 31287 代理人: 于晓菁
地址: 200232*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 时间序列 符号串 异常点 后缀树 检测 训练数据集 概率 符号化 待检测数据 离散化处理 常规模式 后缀符号 异常模式 应用问题 查全率 离散化 构建 隐含 偏离 转换
【说明书】:

发明技术方案公开了一种时间序列异常点的检测方法,包括如下步骤:S1:离散化原始时间序列并获得符号串;S2:对符号串中数据进行标记,形成符号化的训练数据集;S3:根据符号化的训练数据集构建概率后缀树;S4:根据所述概率后缀树检测待检测数据序列中的异常点。本发明技术方案的时间序列异常点的检测方法能够找出偏离常规模式的异常模式,能够较准确的揭示出数据中隐含的信息,从而解决很多实际应用问题,时间序列经过离散化处理转换为符号串后可以表示为概率后缀树,更加简洁且可以更加高效地计算不同符号串的后缀符号的概率,且查全率高、检测效果佳。

技术领域

本发明涉及数据检测领域,尤其涉及一种时间序列异常点的检测方法。

背景技术

时间序列数据是一种在日常应用中经常出现的数据形式。它在航空航天、医疗数据分析、金融数据分析、网络异常行为检测、天气预测等各个领域都有着广泛的应用。在这些应用领域中,挖掘序列中的频繁模式可能无法揭示数据行为中隐藏的异常信息,但这些异常信息通常能反映一定的问题,例如,用户日常操作信息中的异常数据可能意味着该账户密码泄露或是账户被盗用。医疗健康数据中的异常信息可能代表某种疾病正在蔓延。如果不能挖掘出这些信息中的异常,也就不能及时做出合理的决策来避免不必要的损失。

现有技术也逐渐出现一些模型对时间序列的异常进行检测,如马尔可夫链模型、概率后缀树等。马尔可夫链模型被广泛使用,该模型是基于前一个状态决定后一个状态的思想,对于一个长序列,给定一个频繁出现的前缀状态,其后缀状态的发生频率过低,那么这个后缀状态就认为是异常,但是其最大的缺点是前缀状态的长度是固定的。概率后缀树(PST)可以被看作是一种可变长前缀的马尔可夫链更简洁的表示,它扩充了原有的后缀树模型,以每个结点对应符号串的概率分布作为主要特征。在用马尔可夫模型计算条件概率时,前缀长度是定长的,而概率后缀树的前缀长度是可变的。E.Keogh首次提出将后缀树模型用于异常模式检测,并明确定义了异常模式和树结点的概率。P.Sun又对原有的PST模型进行了扩充,改进了结点的结构,然后通过相似性对比来找出异常序列。

然而,这些算法都是在时间序列数据库中找寻异常的时间序列,鲜有检测异常数据点的算法。而在长时间序列或流式数据中,异常检测主要是面向数据点。

发明内容

有鉴于现有技术的上述缺陷,本发明技术方案所要解决的技术问题是现有技术不能挖掘出数据信息中的异常,即便能够挖掘出信息异常,其所用算法都是在时间序列数据库中找寻异常的序列,鲜有直接检测异常数据点的算法,如长时间序列或流式数据中的异常数据点便无法准确检测出。

为解决上述技术问题,本发明技术方案提供了一种时间序列异常点的检测方法,本发明技术方案主要是基于概率后缀树的符号串异常点检测,利用符号化方法离散处理原始时间序列的检测方法,其不仅能够满足于检测短序列数据,在长序列数据的检测上相比其他检测方式更具有优势。

本发明的时间序列异常点的检测方法,包括如下步骤:

S1:离散化原始时间序列并获得符号串;

S2:对符号串中数据进行标记,形成符号化的训练数据集;

S3:根据符号化的训练数据集构建概率后缀树;

S4:根据所述概率后缀树检测待检测数据序列中的异常点。

需要说明的是,步骤S1中,原始时间序列的长短根据实际情况确定,本发明的时间序列一般需要连续。步骤S1具体包括如下步骤:

S11:采用PAA方法对所述原始时间序列进行表示形成若干PAA段,若干所述PAA段与所述原始时间序列的数据点一一对应;所述PAA方法是指用等宽度窗口分割时间序列,每个窗口内的时间序列的值用窗口平均值来表示。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民用航空上海航空器适航审定中心,未经中国民用航空上海航空器适航审定中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811410281.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top