[发明专利]一种时间序列中的异常数据校正方法、装置及处理设备在审
申请号: | 201810556799.0 | 申请日: | 2018-06-01 |
公开(公告)号: | CN108846058A | 公开(公告)日: | 2018-11-20 |
发明(设计)人: | 李莹洁 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉 |
地址: | 英属开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 时间序列 校正 异常数据 处理设备 变化趋势 自动识别 自动校正 准确度 分解 不规则 | ||
本说明书的一个实施例提供一种对时间序列中的异常数据进行校正的方法、装置及处理设备,该方法包括:对时间序列进行分解,至少分解出第一时间序列和第二时间序列,所述第一时间序列反映所述时间序列的变化趋势,所述第二时间序列反映所述时间序列的不规则变动;分别校正所述第一时间序列和/或所述第二时间序列;根据校正后的所述第一时间序列和/或校正后的所述第二时间序列生成校正后的所述时间序列。利用本发明技术方案,可以自动识别时间序列中的异常数据并进行自动校正,提高了异常数据校正的效率和准确度。
技术领域
本说明书实施例涉及数据处理技术领域,特别涉及一种时间序列中的异常数据校正方法、装置及处理设备。
背景技术
时间序列分析是一种应用广泛的分析方法,其主要目的是根据已有的历史数据对未来进行预测,通常应用在国民经济宏观控制、区域综合发展规划、企业经营管理、市场潜量预测、风险业务控制、气象预报、水文预报、地震前兆预报、农作物病虫灾害预报、环境污染控制等方面。
在时间序列分析中,时间序列中的异常数据的检测与校正是该领域的一个基础且重要的问题。异常数据会影响整个时间序列分析模型预测的准确率,例如,如果一个时间序列当中存在多个有影响的异常数据,会大大降低时间序列分析模型预测的准确率。
应该注意,上面对技术背景的介绍只是为了方便对本说明书实施例的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本说明书实施例的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
发明内容
本说明书的一个实施例提供一种对时间序列中的异常数据进行校正的方法,能够提高异常数据校正的效率和准确度。
根据本说明书实施例的一个方面,提供一种对时间序列中的异常数据进行校正的方法,所述方法包括:
对时间序列进行分解,至少分解出第一时间序列和第二时间序列,所述第一时间序列反映所述时间序列的变化趋势,所述第二时间序列反映所述时间序列的不规则变动;
分别校正所述第一时间序列和/或所述第二时间序列;
根据校正后的所述第一时间序列和/或校正后的所述第二时间序列生成校正后的所述时间序列。
根据本说明书实施例的第二方面,提供一种如第一方面所述的方法,其中,所述校正所述第一时间序列包括:
对所述第一时间序列进行线性拟合或者非线性拟合,生成校正后的第一时间序列。
根据本说明书实施例的第三方面,提供一种如第一方面所述的方法,其中,所述校正所述第二时间序列包括:
对所述第二时间序列中超过规定的置信区间的异常数据进行校正。
根据本说明书实施例的第四方面,提供一种如第三方面所述的方法,其中,对所述异常数据进行校正包括:
利用所述第二时间序列的部分或全部数据校正所述异常数据。
根据本说明书实施例的第五方面,提供一种如第四方面所述的方法,其中,在所述异常数据处于所述第二时间序列的第一个时间单位内的情况下,用所述第二时间序列的平均值替换所述异常数据;
在所述异常数据处于所述第二时间序列的最后一个时间单位内的情况下,用所述第二时间序列的平均值替换所述异常数据;
在所述异常数据不处于所述第一个时间单位内并且也不处于所述最后一个时间单位内、并且所述异常数据是其所处的时间单位中的第m个数据的情况下,用所述异常数据所处的该时间单位的前一个时间单位的第m个数据和后一个时间单位内的第m个数据的平均值替换所述异常数据,其中m为自然数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810556799.0/2.html,转载请声明来源钻瓜专利网。