[发明专利]异常点检测方法、装置、设备及存储介质在审
申请号: | 201910749953.0 | 申请日: | 2019-08-14 |
公开(公告)号: | CN112395120A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 李曦 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 彭琼 |
地址: | 开曼群岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异常 检测 方法 装置 设备 存储 介质 | ||
1.一种异常点检测方法,其中,包括:
获取被监测系统的业务指标时间序列的测量数据;
确定针对所述业务指标时间序列的均值基线,并计算所述测量数据与所述均值基线的测量残差数据;
对所述测量残差数据进行残差预测,生成预测残差数据;
根据所述预测残差数据和所述测量残差数据,确定所述被监测系统在时间序列上的异常点。
2.根据权利要求1所述的方法,其中,
所述业务指标时间序列包括多个离散点;所述多个离散点包括第一离散点,所述第一离散点的测量数据用于表示所述第一离散点所属第一时间窗内的统计数据。
3.根据权利要求2所述的方法,其中,确定针对所述业务指标的均值基线,包括:
按照时间周期从所述业务指标的历史数据中获取多个离散点的历史子数据;
其中,分别选取每个离散点之前预设数量的离散点的测量数据,进行均值计算,确定针对所述第一离散点的均值基线。
4.根据权利要求1所述的方法,其中,根据所述预测残差数据和所述测量残差数据,确定所述被监测系统在时间序列上的异常点,包括:
计算所述测量残差数据与所述预测残差数据的差值数据;
根据所述差值数据确定置信区间;
若所述测量数据不在所述置信区间内,则确定所述测量数据在时间序列上对应的离散点为异常点。
5.根据权利要求1所述的方法,其中,采用下述各项中的至少一项对所述测量残差数据进行残差预测:
指数平滑法模型、自回归模型、季节性差分自回归滑动平均模型。
6.根据权利要求1所述的方法,其中,还包括:
若所述测量数据属于增量窗口型指标,则分别计算所述测量数据对应的环比时序和同比时序;
根据所述环比时序和所述同比时序,确定环比阈值和同比阈值。
7.根据权利要求6所述的方法,其中,还包括:
若所述测量数据不属于增量窗口型指标,则将所述测量数据转化为所述增量窗口型指标。
8.根据权利要求6所述的方法,其中,还包括:
若按照数据类别确定所述测量数据被划分为占比类指标数据或者量级指标数据,则所述测量数据为增量窗口型指标。
9.根据权利要求6所述的方法,其中,确定环比阈值和同比阈值的步骤之前,还包括:
对所述环比时序和所述同比时序进行数据清洗。
10.根据权利要求9所述的方法,其中,根据所述预测残差数据和所述测量残差数据,确定所述被监测系统在时间序列上的异常点,包括:
根据所述环比阈值、所述同比阈值、所述预测残差数据和所述测量残差数据,确定所述被监测系统在时间序列上的异常点。
11.根据权利要求10所述的方法,其中,根据所述环比阈值、所述同比阈值、所述预测残差数据和所述测量残差数据,确定所述被监测系统在时间序列上的异常点,包括:
根据所述预测残差数据和所述测量残差数据确定置信区间;
若所述测量数据不在所述置信区间内,则所述测量数据在时间序列上对应的离散点作为假设异常点;
利用所述环比阈值和所述同比阈值确定所述假设异常点是否为异常点。
12.根据权利要求1所述的方法,其中,还包括:
采用孤立森林模型或者局部异常因子算法,确定所述异常点的离散程度。
13.根据权利要求1所述的方法,其中,所述被监测系统的业务指标包括下述中的至少一种:访问量、人机对话轮次、人机对话量、转人工率、单轮对话解决率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910749953.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:导航方法、装置、电子设备及存储介质
- 下一篇:一种聚羧酸超塑化剂及其制备方法