[发明专利]一种业务数据的时间序列可复用异常检测方法及系统在审
申请号: | 202011305978.0 | 申请日: | 2020-11-19 |
公开(公告)号: | CN114548465A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 王瑾;姜宇;汤春艳;孙梦嘉;朱仝;王磊;伍治平;王建纲 | 申请(专利权)人: | 上海宝信软件股份有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/10;G06F17/14 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200120 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 业务 数据 时间 序列 可复用 异常 检测 方法 系统 | ||
本发明提供了一种业务数据的时间序列可复用异常检测方法及系统,包括:步骤1:获取业务历史数据,根据数据平稳性、周期性、相关性和时间粒度对业务数据进行检测;步骤2:根据上述检测结果为所述业务数据匹配适合的时间序列算法,形成映射关系;步骤3:将所述时间序列和算法的映射关系及参数保存在样本库;步骤4:获取同一业务实时数据,根据步骤3样本库中的映射算法及最优参数对所述业务数据进行预测,根据预测结果确定预测区间;步骤5:比较实际值和同时段预测区间的关系,连续超出预测范围10次以上进行告警。本发明可以动态阈值实时监测,无需过多的人为参与,减少告警的误报漏报,有效节省人力成本。
技术领域
本发明涉及大数据异常检测方法领域,具体地,涉及一种业务数据的时间序列可复用异常检测方法及系统。
背景技术
传统监控运维中通常根据专家经验设定静态阈值进行监控告警。阈值过低,告警过于频繁,运维人员需花费大量时间判断系统是否真的存在问题,久而久之“狼来了”现象凸显,失去了告警的意义。阈值过高,质量隐患难以发现,导致遗漏许多性能故障早期现象,等到问题严重,或许用户已感知系统异常,运维工程师却一无所知。
异常检测中,时间序列分析法是常用的方法之一。时间序列分析法是通过数理方法,研究以时间顺序排列的数据集遵从的统计规律,从而推测数据未来发展趋势,指导解决实际问题。常见的时间序列分析法包括指数平滑法、差分整合移动平均自回归模型(Autoregressive Integrated Moving Average model,ARIMA)和Prophet等。
而针对不同业务数据应使用不同的异常检测算法,业务数据较少时可使用人工判断适合算法,当面对大规模业务数据时人工介入存在很大的局限性。因此,需要一种针对大规模业务数据分类建立时间序列异常检测的方法。
公开号为CN104866930A的专利文献“一种基于定量筛选时间序列预测模型的时间序列预测方法”,解决了现有时间序列预测模型的定量筛选准确度低的问题。跟本发明解决的技术问题并不相同。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种业务数据的时间序列可复用异常检测方法及系统。
根据本发明的一个方面,提供了一种业务数据的时间序列可复用异常检测方法,包括:
步骤1:获取业务历史数据,根据数据平稳性、周期性、相关性和时间粒度对业务数据进行检测;
步骤2:根据上述检测结果为所述业务数据匹配适合的时间序列算法,形成映射关系;
步骤3:使用映射的时间序列算法对所述业务数据进行建模,训练最优参数,将所述时间序列和算法的映射关系及参数保存在样本库;
步骤4:获取同一业务实时数据,根据步骤3样本库中的映射算法及最优参数对所述业务数据进行预测,根据预测结果确定预测区间;
步骤5:获取所述分析时间段的实际值,比较实际值和同时段预测区间的关系,连续超出预测范围10次以上进行告警。
优选地,所述步骤1包括:
步骤1.1:通过ADF判断所述时间序列是否平稳;
步骤1.2:使用傅里叶变化判断所述时间序列是否具有周期性;
步骤1.3:利用Pearson相关系数判断所述时间序列是否具有相关性;
步骤1.4:根据业务特征判断所述时间序列的时间粒度。
优选地,所述步骤2包括:
步骤2.1:探究时间序列算法原理,总结各类时间序列算法的应用场景和适用范围;
步骤2.2:将上述时间序列检测结果与时间序列算法做映射关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海宝信软件股份有限公司,未经上海宝信软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011305978.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置