[发明专利]基于全局信息的时间序列数据中异常数据点的识别方法有效

专利信息
申请号: 201810489464.1 申请日: 2018-05-21
公开(公告)号: CN108733812B 公开(公告)日: 2021-09-14
发明(设计)人: 王晓玲;刘小捷;宋光旋 申请(专利权)人: 华东师范大学
主分类号: G06F16/215 分类号: G06F16/215;G06F16/2458
代理公司: 成都行之专利代理事务所(普通合伙) 51220 代理人: 温利平
地址: 200062 上*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 全局 信息 时间 序列 数据 异常 据点 识别 方法
【说明书】:

发明公开了基于全局信息的时间序列数据中异常数据点的识别方法,包括步骤:获取原始时间序列数据及各数据点的观测值;计算各数据点的观测值变化速度和各数据点的速度变化率;根据各数据点的速度变化率,计算原始时间序列数据的平均速度变化率,统计各数据点的速度变化率的离散概率分布,并对离散概率分布进行拟合得到概率密度函数;根据时间序列数据的值变化速度约束和数据点的速度变化率,检测异常数据点。将时间序列数据的平均速度变化率和速度变化率的概率分布作为全局信息,充分反应了时间序列数据的整体特性,通过查找违背整体特性的数据点能够对异常数据点进行有效识别,识别出异常数据点。该方法对时间序列数据中突发异常数据点能准确识别。

技术领域

本发明属于数据清洗领域,更为具体地讲,涉及一种基于全局信息的时间序列数据中异常数据点的识别方法。

背景技术

随着信息技术的发展,数据无时无刻不在产生和使用。各行各业的数据在不断地增长,数据已经在人们的生活中成为了十分重要的角色。由于各种各样的传感器被广泛使用,日常生活中越来越多的时间序列数据被采集和应用,例如气温数据和GPS轨迹数据。因为这些数据中蕴含着丰富的信息,使得时间序列数据挖掘成为了当今的一个热门研究课题。然而,与此同时脏数据也广泛存在于时间序列数据中,低质量的时间序列数据给数据挖掘和分析带来了巨大的影响。毫无疑问,通过清洗时间序列数据,从而提高时间序列数据的数据质量,可以有效地改善数据挖掘的结果,具有重要意义。

其中,如何从时间序列数据中检测突发异常点,是数据清洗中的一项重要内容。由于传感器错误和其他原因,导致时间序列数据中通常存在一些错误的数据点。而这些错误的异常数据点的位置通常难以判断,使得时间序列数据清洗成为极具挑战性的问题。基于平滑的方法通常用于消除序列中的异常数据点,如简单移动平均(SMA)和指数加权移动平均(EWMA)。然而,这类方法仅对序列中的所有数据点都进行平滑处理,难以有效判断异常点的位置。

综上,目前在识别时间序列数据中的突发异常数据点时,存在难以有效准确的判断异常数据点的位置的问题,从而影响对异常数据点的识别。

发明内容

本发明的目的在于克服现有技术的不足,提供一种基于全局信息的时间序列数据中异常数据点的识别方法,实现对时间序列数据中突发异常数据点的准确识别。

为实现上述发明目的,本发明一种基于全局信息的时间序列数据中异常数据点的识别方法,包括以下步骤:

S1:获取原始时间序列数据;

S2:根据所述原始时间序列数据中各数据点的观测值,计算各数据点的观测值变化速度,并根据各数据点的观测值变化速度计算出各数据点的速度变化率;

S3:统计原始时间序列数据各数据点的平均速度变化率和速度变化率的离散概率分布,并使用正太分布拟合速度变化率的概率分布,得到概率密度函数;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810489464.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top