[发明专利]识别网站的潜在恶意用户的方法和装置有效
申请号: | 201610355383.3 | 申请日: | 2016-05-26 |
公开(公告)号: | CN107438050B | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | 谢贵霞;肖勃飞;罗尚勇;袁和应;梅尚健 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吕雁葭 |
地址: | 100080 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 网站 潜在 恶意 用户 方法 系统 | ||
本发明提供了一种识别网站的潜在恶意用户的方法,包括:基于用户基础数据和业务数据,使用Fast Unfolding算法生成社区网络图;从所述社区网络图获取社区信息,所述社区信息包括社区网络图的社区属性和图属性;基于用户基础数据、业务数据和所属社区的社区信息,生成宽表,基于宽表生成衍生字段,所述衍生字段是能够用于判断用户是否为恶意用户的字段;被选择用于训练的用户的特征数据作为训练数据,使用随机森林算法进行建模,得到随机森林模型,其中特征数据包括用户的基本信息、用户的社区信息、以及相应衍生字段;以及使用随机森林模型进行恶意用户识别。本发明还提供了一种识别网站的潜在恶意用户的装置。
技术领域
本发明总体上涉及数据分析,更具体地涉及一种识别网站的潜在恶意用户的方法和装置。
背景技术
随着网络技术的普及,越来越多的人开始使用网络进行社交、娱乐和购物等活动,给网站的管理带来了更大挑战。特别地,恶意用户,即非正常操作用户(如进行恶意领券、恶意下单、恶意发帖等操作的用户),可能威胁网站的安全有效运行。因此,识别潜在恶意用户对于保证网站正常平稳运行具有重要意义。
目前的恶意用户识别方法一般基于基础指标建模,基于基础数据表信息进行指标整合,生成宽表;然后基于宽表数据,使用机器学习算法包提供的算法进行数据建模,基于模型进行恶意用户识别。这种方法的缺点是,统计维度比较单一,保留的信息相对较少,不利于识别潜在恶意用户。
Fast Unfolding算法是一种基于模块度的图算法模型。该算法速度快,扩展性强,适合大数据量的网络社区发现。社区是指具有共同之处的交易用户所形成的关系网络。社区是一个子图,包含顶点和边。同一社区内的节点与节点之间的连接很紧密,而社区与社区之间的连接比较稀疏。Fast Unfolding算法主要包括两个阶段,如图1所示。第一阶段称为模块度优化(Modularity Optimization),主要是将每个节点划分到与其邻接的节点所在的社区中,以使得模块度的值不断变大。模块度由Newman等人提出,是指网络中连接社区结构内部顶点的边所占的比例与另外一个随机网络中连接社区结构内部顶点的边所占比例的期望值相减得到的差值。模块度是常用的度量社区划分的好坏的方法。模块度越高,社区划分越好。第二阶段称为社区聚合(Community Aggregation),主要是将第一步划分出来的社区聚合成为一个点,即根据上一步生成的社区结构重新构造网络。重复以上的过程,直到网络中的结构不再改变为止。
发明内容
本发明的一个方面提供了一种识别网站的潜在恶意用户的方法,包括:基于用户基础数据和业务数据,使用Fast Unfolding算法生成社区网络图;从所述社区网络图获取社区信息,所述社区信息包括社区网络图的社区属性和图属性;基于用户基础数据、业务数据和所属社区的社区信息,生成宽表,基于宽表生成衍生字段,所述衍生字段是能够用于判断用户是否为恶意用户的字段;被选择用于训练的用户的特征数据作为训练数据,使用随机森林算法进行建模,得到随机森林模型,其中特征数据包括用户的基本信息、用户的社区信息、以及相应衍生字段;以及使用随机森林模型进行恶意用户识别。
本发明的另一个方面提供了一种识别网站的潜在恶意用户的装置,包括:用于基于用户基础数据和业务数据,使用Fast Unfolding算法生成社区网络图的装置;用于从所述社区网络图获取社区信息的装置,所述社区信息包括社区网络图的社区属性和图属性;用于基于用户基础数据、业务数据和所属社区的社区信息,生成宽表,基于宽表生成衍生字段的装置,所述衍生字段是能够用于判断用户是否为恶意用户的字段;用于将被选择用于训练的用户的特征数据作为训练数据,使用随机森林算法进行建模,得到随机森林模型的装置,其中特征数据包括用户的基本信息、用户的社区信息、以及相应衍生字段;以及用于使用随机森林模型进行恶意用户识别的装置。
本发明的另一个方面提供了一种识别网站的潜在恶意用户的装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如上所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610355383.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种恶意登录识别方法及装置
- 下一篇:吊灯(1114)