[发明专利]网站异常流量的检测方法及装置有效
申请号: | 201710882594.7 | 申请日: | 2017-09-26 |
公开(公告)号: | CN109561052B | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 喻鹏 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;H04L41/14;H04L43/16 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网站 异常 流量 检测 方法 装置 | ||
本发明公开了一种网站异常流量的检测方法及装置。方法包括:统计各个渠道的网站流量在不同维度上的属性取值;依据所述属性取值,分别计算各个渠道在不同维度上的流量占比数据;将相同维度上各个渠道的流量占比数据作为预先训练的维度模型的输入,利用所述维度模型的输出结果,确定所述各个渠道是否为异常渠道。本发明从渠道下不同维度的流量角度出发,对各个渠道在相同维度上的流量占比数据进行分析来确定异常渠道,从而确定出网站异常流量,为用户提供真实的网站流量运营状况。
技术领域
本发明涉及互联网应用技术领域,尤其涉及一种网站异常流量的检测方法及装置。
背景技术
网站异常流量是指网站在运营期间非正常访客带来的流量。网站异常流量的主要来源包括搜索引擎的爬虫、第三方爬虫等数据爬取方,以及网站SEM(Search EngineMarketing,搜索引擎营销)、SEO(Search Engine Optimization,搜索引擎优化)、广告代理等营销方以提升网站流量进行的作弊行为等。
因为网站异常流量类型的多样性,以及网站异常流量类型会随着反异常规则进行不断升级,因此很难通过制定某种特定规则来确定出网站异常流量。
因此,如何确定网站异常流量,为用户提供真实的网站流量运营状况成为当前亟需解决的问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种网站异常流量的检测方法及装置,方案如下:
一种网站异常流量的检测方法,所述方法包括:
统计各个渠道的网站流量在不同维度上的属性取值;
依据所述属性取值,分别计算各个渠道在不同维度上的流量占比数据;
将相同维度上各个渠道的流量占比数据作为预先训练的维度模型的输入,利用所述维度模型的输出结果,确定所述各个渠道是否为异常渠道。
可选的,所述利用所述维度模型的输出结果,确定所述各个渠道是否为异常渠道包括:
所述维度模型采用isolationforest算法计算各个渠道被切分完成所需的切分次数,并依据所述各个渠道的切分次数和所述各个渠道的平均切分次数,确定切分次数小于预设阈值的渠道为异常渠道;其中预设阈值根据各个渠道的平均切分次数得到。
可选的,所述不同维度包括:时间分布维度、设备分布维度、地区分布维度、IP分布维度中的至少一种。
可选的,所述方法还包括:
将相同维度上,确定的正常渠道的流量占比数据进行汇总,计算得到平均流量占比数据;
将确定的异常渠道的流量占比数据与所述平均流量占比数据做差,将差值确定为所述异常渠道的异常流量占比数据。
一种网站异常流量的检测装置,所述装置包括:
统计模块,用于统计各个渠道的网站流量在不同维度上的属性取值;
第一计算模块,用于依据所述属性取值,分别计算各个渠道在不同维度上的流量占比数据;
第一确定模块,用于将相同维度上各个渠道的流量占比数据作为预先训练的维度模型的输入,利用所述维度模型的输出结果,确定所述各个渠道是否为异常渠道。
可选的,所述第一确定模块具体用于,利用所述维度模型采用isolationforest算法计算各个渠道被切分完成所需的切分次数,并依据所述各个渠道的切分次数和所述各个渠道的平均切分次数,确定切分次数小于预设阈值的渠道为异常渠道;其中预设阈值根据渠道的平均切分次数得到。
可选的,所述不同维度包括:时间分布维度、设备分布维度、地区分布维度、IP分布维度中的至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710882594.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:内容分发网络安全检测方法及系统
- 下一篇:一种用户身份识别方法及装置