[发明专利]一种异常数据的检测方法、系统及设备有效
申请号: | 201911239601.7 | 申请日: | 2019-12-06 |
公开(公告)号: | CN111092757B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 陈芹浩 | 申请(专利权)人: | 网宿科技股份有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;G06K9/62 |
代理公司: | 北京华智则铭知识产权代理有限公司 11573 | 代理人: | 陈刚 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 异常 数据 检测 方法 系统 设备 | ||
1.一种异常数据的检测方法,其特征在于,所述方法包括:
获取指定时段的访问数据,并基于所述访问数据训练得到阈值模型,以及根据所述阈值模型,判断目标时间节点的访问数据是否为异常数据;其中,所述阈值模型中的筛选边界划分出孤立节点,所述孤立节点的数量由域名类型对应的筛选阈值确定,所述域名类型分为平稳型、周期变化型、突刺变化型;
若判定所述目标时间节点的访问数据为异常数据,确定包含所述目标时间节点且与所述域名类型对应的检测区间,并统计所述检测区间内访问数据样本的分布,以及根据统计的所述分布,再次判断所述目标时间节点的访问数据是否为异常数据;其中,在统计的所述分布中确定置信区间,并基于所述置信区间判断异常数据;
若再次判定所述目标时间节点的访问数据为异常数据,获取所述目标时间节点的访问数据对应的所述域名类型的收敛规则和幅度阈值,并基于所述收敛规则和所述幅度阈值,判断所述目标时间节点的访问数据是否为待处理的异常数据。
2.根据权利要求1所述的方法,其特征在于,基于所述访问数据训练得到阈值模型包括:
识别所述访问数据所属的域名类型,并获取所述域名类型对应的筛选阈值;
统计所述访问数据中各个时间节点的访问异常比例,并确定筛选边界,所述筛选边界用于将统计的各个所述访问异常比例划分为聚合节点和孤立节点,其中,所述孤立节点的数量由所述筛选阈值确定;
将具备所述筛选边界的模型作为训练得到的阈值模型。
3.根据权利要求1或2所述的方法,其特征在于,判断目标时间节点的访问数据是否为异常数据包括:
计算所述目标时间节点的访问数据对应的访问异常比例,并将计算的所述访问异常比例输入所述阈值模型中;若所述阈值模型输出的结果为孤立节点,判定所述目标时间节点的访问数据为异常数据;若所述阈值模型输出的结果为聚合节点,判定所述目标时间节点的访问数据为非异常数据。
4.根据权利要求1所述的方法,其特征在于,确定包含所述目标时间节点的检测区间包括:
识别所述目标时间节点的访问数据所属的域名类型,并获取所述域名类型对应的检测时长;
以所述目标时间节点为中心,构建包含所述目标时间节点,并且区间时长与所述检测时长相等的检测区间;其中,构建的所述检测区间作为所述包含所述目标时间节点的检测区间。
5.根据权利要求1所述的方法,其特征在于,统计所述检测区间内访问数据样本的分布包括:
统计所述检测区间内各个访问数据样本的访问异常比例,并计算统计得到的所述访问异常比例的均值和标准差;
根据所述均值和所述标准差对统计得到的所述访问异常比例进行正态分布,并将正态分布的结果作为所述检测区间内访问数据样本的分布。
6.根据权利要求5所述的方法,其特征在于,再次判断所述目标时间节点的访问数据是否为异常数据包括:
根据所述均值和所述标准差,在正态分布的结果中确定置信区间;若所述目标时间节点的访问数据位于所述置信区间外,判定所述目标时间节点的访问数据为异常数据;若所述目标时间节点的访问数据位于所述置信区间内,判定所述目标时间节点的访问数据为非异常数据。
7.根据权利要求1所述的方法,其特征在于,获取所述目标时间节点的访问数据对应的收敛规则包括:
识别所述目标时间节点的访问数据所属的域名类型,并获取所述域名类型对应的收敛规则;其中,所述收敛规则包括:
以所述目标时间节点为起始时间节点,连续指定数量的时间节点处的访问数据均被判定为异常数据;
或者
在包含所述目标时间节点的预设时长内出现指定次数的异常数据。
8.根据权利要求1所述的方法,其特征在于,所述目标时间节点的访问数据对应的幅度阈值按照访问数据的量级进行划分,其中,访问数据的量级越大,对应的幅度阈值越大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网宿科技股份有限公司,未经网宿科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911239601.7/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置