[发明专利]识别及辅助识别虚假流量的方法、装置及系统有效
申请号: | 201610645819.2 | 申请日: | 2016-08-08 |
公开(公告)号: | CN107707509B | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 王鹏;王中要;徐萧萧 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 北京展翅星辰知识产权代理有限公司 11693 | 代理人: | 王文生 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 辅助 虚假 流量 方法 装置 系统 | ||
本申请提供了一种识别及辅助识别虚假流量的方法、装置及系统,所述辅助识别虚假流量的方法包括:收集网络访问流量数据;统计所述访问流量数据的预设特征数据;发送所述预设特征数据给服务器,以便服务器依据所述预设特征数据识别虚假流量。所述识别虚假流量的方法包括:接收客户端发送的访问流量数据的预设特征数据;将所述预设特征数据输入预先训练获得的虚假流量识别模型,以得到所述访问流量数据是否为虚假流量的识别结果。本申请实现了准确识别虚假流量的同时减轻对网络传输造成的压力。
技术领域
本申请涉及互联网技术领域,尤其涉及一种识别及辅助识别虚假流量的方法、装置及系统。
背景技术
虚假流量即机器流量,是恶意访问者通过脚本程序自动频繁地向网络服务器发送请求。该虚假流量不仅不产生任何商业和社会价值,还给网络服务器带来可用性和稳定性风险,给正常用户的访问也带来了不便,同时也对网站的流量分析带来了较大的误差。因此,需要识别出虚假流量,以便对虚假流量进行控制,防止对网络产生的上述影响,保证正常用户的访问和更好的用户体验。
目前,识别虚假流量的方法为:客户端收集网络访问流量数据,将收集到的数据发送到服务器端,服务器根据这些访问流量数据来判断该访问流量是否为虚假流量。
其中,一种方案客户端提取所收集的网络访问流量数据的访问内容和手段相关方面的特征数据,包括:网址、访问时间、ip、登陆id等数据,将提取的特征数据发送给服务器端。该方案的缺点在于:由于随着刷流量技术和利益产业的发展,脚本程序在访问内容和手段上的表现已无法和正常流量区分,因此,服务器端基于访问内容和手段很难准确识别出虚假流量。
另一种方案客户端将网络访问流量明细数据发送给服务器端。该方案的缺点在于:由于发送给服务器端的访问流量明显数据存储量的增长导致数据传输的压力越来越大,对带宽也有了更高的要求,甚至成为了处理效率的瓶颈。
可见,已有的虚假流量识别方案中存在着数据量不足无法准确识别虚假流量的问题,或者数据量过大给网络传输造成压力的问题。因此有必要提供一种新的识别虚假流量的方案,以实现准确识别虚假流量的同时减轻对网络传输造成的压力。
发明内容
本申请解决的技术问题之一是提供一种识别及辅助识别虚假流量的方法、装置及系统,实现了准确识别虚假流量的同时减轻对网络传输造成的压力。
根据本申请一方面的一个实施例,提供了一种辅助识别虚假流量的方法,所述方法包括:
收集网络访问流量数据;
统计所述访问流量数据的预设特征数据;
发送所述预设特征数据给服务器,以便服务器依据所述预设特征数据识别虚假流量。
根据本申请另一方面的一个实施例,提供了一种识别虚假流量的方法,所述方法包括:
接收客户端发送的访问流量数据的预设特征数据;
将所述预设特征数据输入预先训练获得的虚假流量识别模型,以得到所述访问流量数据是否为虚假流量的识别结果。
根据本申请另一方面的一个实施例,提供了一种辅助识别虚假流量的装置,所述装置包括:
收集单元,用于收集网络访问流量数据;
统计单元,用于统计所述访问流量数据的预设特征数据;
发送单元,用于发送所述预设特征数据给服务器,以便服务器依据所述预设特征数据识别虚假流量。
根据本申请另一方面的一个实施例,提供了一种识别虚假流量的装置,所述装置包括:
预设特征数据接收单元,用于接收客户端发送的访问流量数据的预设特征数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610645819.2/2.html,转载请声明来源钻瓜专利网。