[发明专利]网站异常流量的检测方法及装置有效
申请号: | 201710882594.7 | 申请日: | 2017-09-26 |
公开(公告)号: | CN109561052B | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 喻鹏 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;H04L41/14;H04L43/16 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网站 异常 流量 检测 方法 装置 | ||
1.一种网站异常流量的检测方法,其特征在于,所述方法包括:
统计各个渠道的网站流量在不同维度上的属性取值;
依据所述属性取值,分别计算各个渠道在不同维度上的流量占比数据,当所述维度为时间分布维度时,所述流量占比为渠道中每个预设时间段内的总访问量与所述渠道24小时内的总访问量的比值;
将相同维度上各个渠道的流量占比数据作为预先训练的维度模型的输入,利用所述维度模型的输出结果,确定所述各个渠道是否为异常渠道,以确定出网站异常流量,为用户提供真实的网站流量运营状况,其中,所述维度模型为针对不同的维度分别训练得到的不同的维度模型;
所述利用所述维度模型的输出结果,确定所述各个渠道是否为异常渠道包括:利用所述维度模型依据各个渠道被切分完成所需的切分次数以及预设阈值进行比较得到的输出结果,确定切分次数小于预设阈值的渠道为异常渠道,其中,所述各个渠道被切分完成所需的切分次数由所述维度模型采用isolationforest算法计算得到,所述预设阈值根据各个渠道的平均切分次数得到,所述输出结果表征各个渠道是否为异常渠道。
2.根据权利要求1所述的方法,其特征在于,所述不同维度包括:时间分布维度、设备分布维度、地区分布维度、IP分布维度中的至少一种。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将相同维度上,确定的正常渠道的流量占比数据进行汇总,计算得到平均流量占比数据;
将确定的异常渠道的流量占比数据与所述平均流量占比数据做差,将差值确定为所述异常渠道的异常流量占比数据。
4.一种网站异常流量的检测装置,其特征在于,所述装置包括:
统计模块,用于统计各个渠道的网站流量在不同维度上的属性取值;
第一计算模块,用于依据所述属性取值,分别计算各个渠道在不同维度上的流量占比数据,当所述维度为时间分布维度时,所述流量占比为渠道中每个预设时间段内的总访问量与所述渠道24小时内的总访问量的比值;
第一确定模块,用于将相同维度上各个渠道的流量占比数据作为预先训练的维度模型的输入,利用所述维度模型的输出结果,确定所述各个渠道是否为异常渠道,以确定出网站异常流量,为用户提供真实的网站流量运营状况,其中,所述维度模型为针对不同的维度分别训练得到的不同的维度模型;
所述第一确定模块具体用于,利用所述维度模型依据各个渠道被切分完成所需的切分次数以及预设阈值进行比较得到的输出结果,确定切分次数小于预设阈值的渠道为异常渠道,其中,所述各个渠道被切分完成所需的切分次数由所述维度模型采用isolationforest算法计算得到,所述预设阈值根据各个渠道的平均切分次数得到,所述输出结果表征各个渠道是否为异常渠道。
5.根据权利要求4所述的装置,其特征在于,所述不同维度包括:时间分布维度、设备分布维度、地区分布维度、IP分布维度中的至少一种。
6.根据权利要求4所述的装置,其特征在于,所述装置还包括:
第二计算模块,用于将相同维度上,确定的正常渠道的流量占比数据进行汇总,计算得到平均流量占比数据;
第二确定模块,用于将确定的异常渠道的流量占比数据与所述平均流量占比数据做差,将差值确定为所述异常渠道的异常流量占比数据。
7.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如权利要求1-3中任一项所述的网站异常流量的检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710882594.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:内容分发网络安全检测方法及系统
- 下一篇:一种用户身份识别方法及装置