[发明专利]一种基于通信行为画像的代理使用者检测方法有效
申请号: | 201910447829.9 | 申请日: | 2019-05-27 |
公开(公告)号: | CN110225009B | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 陈兴蜀;韩珍辉;朱毅;曾雪梅;殷明勇 | 申请(专利权)人: | 四川大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 成都禾创知家知识产权代理有限公司 51284 | 代理人: | 裴娟 |
地址: | 610065 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于通信行为画像的代理使用者检测方法,基于通信行为构建画像模型;对输入的真实流量数据进行预处理,以指定时间窗口按照组织用户IP属性和时间属性对网络流量进行聚合,得到每一个用户的流量数据;基于流量数据提取指定时间窗口内用户的通信对象稳定性特征以及通信对象数量特征,然后基于阈值对上述两个特征进行过滤筛选得到疑似代理使用者的IP信息;针对每一个疑似代理用户的网络流量进行机器学习检测分类;对于流量判定结果满足阈值设定的IP标记为代理使用者IP。本发明检测方法通用性高,能够满足目前大数据网络环境下的数据量,采用了基于通信行为的画像模型,检测误报率较低。 | ||
搜索关键词: | 一种 基于 通信 行为 画像 代理 使用者 检测 方法 | ||
【主权项】:
1.一种基于通信行为画像的代理使用者检测方法,其特征在于,包括以下步骤:步骤1:基于通信行为构建画像模型,包括建立标签体系和构建画像特征;步骤1.1:分析需要解决的问题,确定画像对象以及采用的数据源信息;根据对画像对象进行深入的剖析筛选,确定能够抽象该对象的标签;采用数据挖掘方法采集标签可能用到的外源数据集构造标签数据集,确定每一项标签详细的标记规则;整合所有的标签,建立需要分析对象的标签体系;步骤1.2:根据确定的标签体系对数据进行相关属性的提取;采用数据聚合分析方法统计每一类标签的表现结果;根据所有的标签分析结果构建画像特征;步骤2:对输入的真实流量数据进行预处理;以指定时间窗口按照组织用户IP属性和时间属性对网络流量进行聚合,得到每一个用户的流量数据;步骤3:发现可疑用户;基于流量数据提取指定时间窗口内用户的通信对象稳定性特征以及通信对象数量特征,然后基于阈值对上述两个特征进行过滤筛选得到疑似代理使用者的IP信息,存储这些IP的流量进行下一步检测;步骤4:针对每一个疑似代理用户的网络流量进行机器学习检测分类,首先对流量数据预处理转换为画像模型的特征向量,随后输入至已经训练好的机器学习分类器中对用户的流量进行分类判定;对于流量判定结果满足阈值设定的IP标记为代理使用者IP。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910447829.9/,转载请声明来源钻瓜专利网。